2022 Kaggle Data Science & ML Survey

2022年 kaggle 数据科学 & 机器学习调查报告

相比于2020年的详细报告, 2022年的简化很多.

一. 编程技能

p94TQNd.png
  • Python, 没什么好说的了, 黏合一切.
  • SQL, 假如一个人号称自己是从事数据相关工作的, 但是不会SQL, 那么大概率可以认为该人说谎.
  • R, 老牌的数学处理语言.
  • Java, 这个传统语言向新的领域扩展.
  • JavaScript, 前端对于数据在可视化, 交互起等方面起到关键的作用(跨平台的桌面应用程序框架, Electron攻城掠地中...).
  • C/C++, Python的地基.

二. 作业工具

p94T5CR.png
  • vscode, 编辑器终结者. (但是需要注意的是, jupyter同样可以运行在vscode(Electron)上, 而且使用体验比浏览器端的jupyter更好, 但是功能没有浏览器端的强大)
  • Jupyter, 一站式作业终端.

三. 机器学习框架

p94T83t.png
  • sklearn, 基础
  • tensorflow/keras, 深度学习, 神经网络.
  • 各种boost, 号称赛事专用.
  • Pytorch, Facebook出品的产品多不温不火, 之前的时间序列Prophet已经不再单独列出了.

四. 其他值得关注点

Transformer模型详解(图解最完整版)

p94T39I.png

相关云服务提供商

p94Tl4A.png