1 采访资深数据科学家:成为数据科学家应具有的品质-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

采访资深数据科学家:成为数据科学家应具有的品质

如意 来源:百家号 作者:读芯术 2020-06-30 11:28 次阅读

作为一门逐渐成熟的新兴领域,与数据科学相关的很多领域开始变得备受青睐,比如数据工程,数据分析以及机器学习深度学习。数据科学家们必须带着具有科学性、创造性和研究性的思维,从各路数据集中提取有用信息,以解决客户面临的潜在挑战。

生活会不断衍生出数据,涉及零售、交通、金融和医疗健康领域。触手可及的各类计算产品人工智能的飞速发展将一群通过获取、分析和利用原始数据的数据科学家们推到了聚光灯下。

2016年,数据科学家们选出了在北美洲最受欢迎的50种工作,这份榜单是参考收入潜力、工作满意度以及在Glassdoor招聘网站上的需求量等各项指标得出的结果。

所以成为一名数据科学家应具备哪些品质呢?

为了搞清楚这个问题,我采访了Ben Chu,他是路孚特实验室的一名资深数据科学家。Chu有人工智能领域的背景,擅长处理语言、语义和图表,并且在新加坡的路孚特实验室有着两年的工作经验。

1.保持好奇

Chu在访谈的一开始就提到,数据科学家应该像调查员一样思考。你要时刻保持好奇,永远都想知道“为什么?”“就好像自己是一个侦探,通过这些数据拼凑细节以寻找新的线索。”

在金融界,数据科学家们从一系列数据集中提取信息,以供客户参考并帮助制定决策。数据科学家们会把目光锁定在客户想要解决的问题上面,然后从他们获得的数据中抽丝剥茧,得出线索。

通过和Chu的交谈,我领悟到了抓重点的重要性,调查背景也是很重要的。如果不能解决潜在问题,即使是再完美的分析也无助于此。有时候你需要转回来,尝试新的方法,重新思考问题。核心在于要保持好奇,爱上提问。

2.有创造力

数据科学并不仅仅指一种科学的方法,这个称号其实会误导大家。你不一定要有科研背景,但必须有创新性思维——另一种思维是解决问题的关键。

“我经常在两种思维之间来回切换,是通过科学性思维还是创造性思维来探索更多的新的不同的解决方式。有逻辑的、科学的思考对于结论产出的帮助是必不可少的,但具备创造性思维也同样重要:我也将成功和失败的案例视为观察新模式的线索。”

3.学习如何编码

你需要扎实的编码技能,才能预处理不同的数据源,并且能够使用各种数据处理技术,来解决棘手或不完整的数据。你得能够创建一个机器学习管道,这要求你知道如何构建模型,如何使用工具和框架来评估和分析其性能。

与大多数数据科学家一样,Chu使用Python,因为里面有许多很赞的包可用于操作和建模数据。事实上,GalasWalk在2017的上半年为数据科学家提供了10000份招聘信息,发现Python、R和SQL这三种特殊技能是数据科学中大多数职位空缺的根本原因。

Ben Chu的团队依赖于开源的机器学习软件包,如Tensorflow、Pytorch和BERT。

“我们主要将Confluence用作文档工具;MLFlow、Amazon Sagemaker、Scikit Learn、Tensorflow、PyTorch和BERT用于机器学习;Apache Spark用于在大型数据集上构建快速数据管道;Athena用作处理后数据的存储数据库。我们还使用Superset连接数据,轻松构建仪表板以输出图表,使其更直观。”

4.科学思考

数据科学家们会运用不同的工具来管理流程、数据、进行注释和编码。“我必须十分努力,时刻衡量并追踪自己的进度,这样才有机会开展复盘工作,尝试新的方向,不断比对结果。”

“重要的是要时刻秉持科学的原则,在分析时参考相应的数据,实验和文献,以便随时调整结论。我需要把这些资料整理好,所以我会用Notion作为初步保存所有笔记、论文和可视化的基本工具。

Chu强调,不仅要保留目前的调查记录,还要保留以前所有调查结果的记录。“这就像是一本数据科学日志。每当遇到类似的情况时,我都会把值得参考的要点保存好,下次再遇到问题时可以有指导。”

5.担心“冒名顶替综合征”,大可不必

Chu现在是路孚特实验室的资深数据科学家,但他年少时曾想成为一名音乐家,并且对语言特别着迷。“对于我在自然语言处理领域的工作,这需要我对语言学有较深的了解,特别是语义学和语言的细微差别。”

他解释说,一个数据科学团队需要一系列技能——他和他的同事拥有从不同背景发展而来的重叠技能。

“你需要的技能将取决于工作领域。比如我需要对金融领域有很好的了解,数据分析目前应用于防诈骗领域,通过建立异常检测方法来检测交易数据中不符合规范的欺诈‘行为’”。

“像我这样的数据科学家需要懂得如何处理各种孤立的金融数据。关键是要建立各种数据之间的联系,如果不知道它们之间的联系的话,就无法建立一个成功的模式。”

做一名计算机科学家或数学家并不是进入数据科学领域的必要条件。没有人精通所有领域。你可能有法律、经济或科学背景。这些背景决定了你的思考方式。如果能灵活运用各种知识并将其系统化,那么在使用工具、框架和数据集时,就能够熟悉这些工具、框架和数据集的细节。

如何开始

对于那些热衷于数据科学技能的人,Chu提供了一些实用的技巧,这些技巧很容易学会。你可以寻找研究社区,参加网络研讨会,并在网上寻找找到培训课程。一旦可以进行当面交流,Chu建议你在数据科学领域活跃起来。

“参加会议和编程马拉松,这将帮助你研究建立一个强大的网络,让你有机会说出自己的想法,启发研究和回答疑问”。

数据科学是一个全新的领域,而且还在处于不断成熟阶段。随着机器学习和深度学习工程师的出现,数据科学家、数据工程师和数据分析员等各种不同的职位也出现了,也许你会发现自己更适合或者更喜欢另一个职位呢。

一切都在不断变化之中,永葆好奇心和创造力,继续探索吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程
    +关注

    关注

    88

    文章

    3614

    浏览量

    93685
  • 数据分析
    +关注

    关注

    2

    文章

    1445

    浏览量

    34047
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10052
收藏 人收藏

    评论

    相关推荐

    AI 推动未来科学 晶泰科技共襄未来科学大奖周

    科学家,探讨学科交叉与学术创新,倾力打造兼具权威性、专业性和国际影响力的科学盛会。 未来科学大奖由未来论坛于 2016 年创设,被誉为"中国诺贝尔奖"。未来论坛是当前中国极具声望的民间科学
    的头像 发表于 12-18 09:58 86次阅读
    AI 推动未来<b class='flag-5'>科学</b> 晶泰科技共襄未来<b class='flag-5'>科学</b>大奖周

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息等企业助力下打造
    的头像 发表于 12-12 15:59 142次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    处理的效率,还为科学研究提供了前所未有的洞察力和精确度。例如,在生物学领域,AI能够帮助科学家快速识别基因序列中的关键变异,加速新药研发进程。 2. 跨学科融合的新范式 书中强调,人工智能的应用促进了多个
    发表于 10-14 09:12

    受人眼启发!科学家开发出新型改良相机

    新型事件相机系统与标准事件相机系统对比图。 马里兰大学计算机科学家领导的一个研究小组发明了一种照相机装置,可以改善机器人观察周围世界并做出反应的方式。受人眼工作原理的启发,他们的创新型照相机系统模仿
    的头像 发表于 07-22 06:24 302次阅读
    受人眼启发!<b class='flag-5'>科学家</b>开发出新型改良相机

    中国科学家发现新型高温超导体

    据新华社报道,我国科学家再立新功,又一新型高温超导体被发现。 复旦大学物理学系赵俊团队利用高压光学浮区技术成功生长了三层镍氧化物,成功证实在镍氧化物中具有压力诱导的体超导电性,而且超导体积分数达到
    的头像 发表于 07-19 15:14 686次阅读

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与机器深度融合的新纪元。
    的头像 发表于 07-08 16:00 602次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 484次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 518次阅读

    科学家研制出一款新型柔性X射线探测器

    英国科学家开发出一种有机半导体材料,并利用其研制出一款新型柔性X射线探测器。这种探测器不仅“身段”更柔软,可贴合需要扫描物体的形状,从而提高患者筛查的准确性,降低肿瘤成像和放射性治疗的风险,而且成本
    的头像 发表于 06-13 06:29 296次阅读

    本源量子参与的国家重点研发计划青年科学家项目启动会顺利召开

    2024年4月23日,国家重点研发计划“先进计算与新兴软件”重点专项“面向复杂物理系统求解的量子科学计算算法、软件、应用与验证”青年科学家项目启动会暨实施方案论证会在合肥顺利召开。该项目由合肥综合性国家科学中心人工智能研究院(安
    的头像 发表于 05-11 08:22 675次阅读
    本源量子参与的国家重点研发计划青年<b class='flag-5'>科学家</b>项目启动会顺利召开

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 1127次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 674次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 484次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1710次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号