積極採用!データサイエンティスト職とは?(4社の業務実例あり)

タイトル画像イメージ

データ。


現代人の生活は、まさしく情報の波の中。



きっと皆さんもドップリですよね?

予めお伝えいたしますと、弊社Build+(ビルドプラス株式会社)は、IT業界特化の転職エージェントです。応募してみたい方は、こちらからどうぞ!




今回は、プリセールスの立場からAIに関わる「AIプリセールス職」のご紹介です。

ChatGPTの要約でも、今回お伝えしたい「コアデータ」が皆さんに届いていますように!

では、早速見ていきましょう!

データサイエンティストの業務概要イメージ

概要説明:

データサイエンティスト職とは?

データサイエンティスト職とは、ズバリ、「製品データを包括的にチェックする」ポジションです。業務としては、データモデルの構築・リリース、市場影響の分析、短期間かつ高頻度のイテレーションを担当します。名称こそ「サイエンティスト」ですが、実際は他部署間協業も多いポジションです。専用研究室で缶詰め…なんてことはございませんので、ご安心ください。主に製品チーム・開発チーム・Bizチームと定期的な業務連携があります。

ここからは、実際の求人を元に4つの異なる専門領域にまたがる「4つのデータサイエンティスト職」の業務実例をご紹介いたします。「データモデル構築+ソフトウェア製品化+プロダクト思考」が共通して求められます。

  • 課題定義(プロダクトマネージャーや各業界専門家との連携あり):

 領域別の業務実例

  • ✈️ 航空機の経路最適化対応(株式会社NABLA Mobility):乱気流の予測

  • ⚙️ 製造業向けCAD / インテリジェントCAD対応(キャディ株式会社):2D作図・CAD作図に基づく製品機能の分析

  • 📈 コミュニティ分析 / CRM分析対応 (コミューン株式会社):顧客リレーションシップや顧客エンゲージメントの評価診断

  • 🔐 SaaS セキュリティ領域対応(HENNGE株式会社):SaaSアクセスログの分析

以下は、データサイエンティスト職全般で共通する項目です。

  • E2Eデータパス管理:

実際の業務の流れ:データインジェスト&ETL👉データラベリング&データ品質管理👉データパイプライン処理👉学習・検証👉製品デプロイ(API連携・バッチ処理あり)👉データ監視

  • 製品リリースとユーザーサポート:

    CI/CD、パイプライン、インフラストラクチャなどを利用したMLOpsの工程です。「いかにユーザーに貢献できるか」が焦点です。

  • イテレーションの完了:

    アジャイルKPI指標の策定、テスト実行、モデルアップデートを担当します。レイテンシ・安全性・コスト・UXなどの実用段階で見込まれる制約の改善・解消に向けた作業です。

業務内容

ここからは、データサイエンティスト職の求人内容を整理していきます。

まずは、主な業務内容を見ていきましょう。

🎯 主な業務内容

  • データモデル構築・分析:新規モデルの構築や現行モデルの改善(自然言語処理、推薦システム、画像データ抽出、時系列解析、PIM(機械への物理法則の組み込み)に関する知識が必須)、アブレーションスタディ、データの視覚化、機械学習を専門としないステークホルダーに向けた簡潔な報告書の作成

  • データ・プラットフォーム管理:スキーマ設計、ETL・ELTによるデータ処理、データ品質管理、データ活用層(BI層)の管理(HENNGE株式会社では、AWSツールを使用したBI層管理を奨励)

  • 製品化:データモデルのAPI連携・バッチ処理、フロントエンドとバックエンドの統合、ドリフトの監視、パフォーマンスの監視(キャディ株式会社では、Vertex AI、Kubeflow、CI/CDの業務利用を奨励)

  • 自社への貢献:「事業ニーズを機械学習で用いる数値データに変換する」のが大きな業務役割です。(株式会社NABLA Mobilityならびにコミューン株式会社では、事業とテクノロジーの橋渡し役としての貢献を期待)

🧰 募集要項:スキル・業務ツール

続いて、業務で欠かせない必見スキルや業務ツールのご紹介です。

  • プログラミング言語:Python(一般的)、TypeScript(サービス業界、UI開発向け)、Rust(高パフォーマンスバックエンド開発向け・キャディ株式会社で使用)

  • 機械学習フレームワーク:PyTorch、scikit-learn、LightGBM

※ LLMやLVM(論理ボリュームマネージャー)の導入が加速しています。余裕のある方は、是非慣れておきましょう。

  • パイプライン・MLOpsツール:Docker(業界標準ツール)

※ Vertex AI Pipelines、Kubeflow、Apache Beam、Apache Spark、GitHub Actions、AWS Lambda、AWS Gatewayシリーズ、 Google Cloud、Google Kubernetes Engine(GKE)なども日々の業務で使うことがあります。

  • データ管理・データ活用層管理ツール:BigQuery、Amazon Redshift、PostgreSQL、dbt(Data Build Tool)、Looker Studio、Redash、Amazon S3やGoogle Cloud Storage(GCS) などのストレージツール

  • インフラストラクチャ管理ツール:AWS (HENNGE株式会社、株式会社NABLA Mobility)、 Google Cloud (キャディ株式会社、コミューン株式会社)、Datadogや Sentryなどの監視ツール

💰 平均給与水準

気になる年収も、先ほどご紹介した業務事例ごとにご紹介いたします。

  • ​​🔐 HENNGE株式会社 データエンジニア職(データサイエンティスト職・機械学習エンジニア職寄り):550万〜930万円

  • ✈️ 株式会社NABLA Mobilit 機械学習データサイエンティスト職:500万円〜750万円

  • ⚙️ キャディ株式会社 機械学習エンジニア職:850万円〜1,200万円 (半期ごとの昇給制度・ストックオプション制度あり)

  • 📈 コミューン株式会社 データサイエンティスト職:880万円〜1,320万円(四半期ごとの昇給制度・評価面談あり)

👀 実務経験者の方へ:

前職でプロダクト製品化の対応経験はありませんか?以下の年収が狙えますよ。

  • ミドルレベルへの転職:600万円〜900万円

  • シニアレベル・プリンシパルレベル・リード職・マネージャー職への転職(企業規模や裁量権で変動あり):900万円〜1,300万円

👔 実際の業務課題例

続いて、今回ご紹介した4つの領域での業務課題をそれぞれご紹介いたします。

  • ✈️ 航空業界(株式会社NABLA Mobility):フライト時間と燃料消費割合、乱気流予測、航空遅延予測、障害物検知・NOTAMデータ自動化対応など。PIML(物理法則を組み込んだ機械学習)の実務応用が求められます。

  • ⚙️ 製造業(キャディ株式会社):2D作図・CAD作図・3Dジオメトリからの構造データ分析、類似検索、データノイズ除去、海外工場で導入されている機械学習APIに合わせたスループットの高速化処理など。

  • 🔐 SaaS セキュリティ業界(HENNGE株式会社):アクセスログのパイプライン処理、ETLの最適化、BI層アクセス権限管理、新規リリース機能の実験データの読み出し処理。

  • 📈 コミュニティプラットフォーム管理 (コミューン株式会社):顧客リレーションシップ・顧客エンゲージメント・レコメンデーション内容のモデル数値設定、「信頼度」や「行動変化」におけるKPI指標策定、運用・管理ツールとしてのAIエージェントの組み込み処理。

キャリア設計

🏃‍♂️ データサイエンティスト職の先へ

データサイエンティスト職になると、今後のキャリアプランも多方面に広がります。

皆さんが進んでみたい方向や専門分野はありますか?

  • シニアレベル・プリンシパルレベルのデータサイエンティスト職 / 機械学習エンジニア職:テクニカルリーダーシップ、モデル・プラットフォーム管理が中心です。

  • 機械学習プラットフォームエンジニア職 / MLOps職:パイプライン処理・管理、ツール管理、大規模プラットフォームでのデータの信頼性を管理します。

  • 各領域の専門家サイド:航空気象学、マシンビジョン、3D、推奨システム、グラフ統計などの専門を突き進めていくポジションです。

  • 技術策定・プロダクト管理の統括ポジション:テックリード職、テクニカルプロダクトマネージャ職、アーキテクト職などがあげられます。

ここからは、実際の応募で求められるスキルや経験をまとめていきます。

募集要項:

  • 💪 ハードスキル(技術スキル):

    • 統計学・基礎的な機械学習の専門知識や問題設計能力

    • 前職での製品化対応経験:モデルデータからの製品化(API連携・バッチ処理あり)、監視作業、バージョン管理、ロールバック処理など

    • データエンジニアリングの高い専門性:SQL、ELT設計、オーケストレーション(Apache AirflowまたはDigdagを使用)、データベーススキーマ設計、データ品質管理など

    • クラウドツール(AWSやGoogle Cloudなど)やコンテナツールDockerなど)の使用スキル:CI/CDでよくお世話になるツールです。是非、克服しておきましょう。

  • 🤝 ソフトスキル(協業スキル):

    • トレードオフ事項の説明や業務上の共通理解作成スキル:「正確性、レイテンシ、ユーザーエクスペリエンス」の相互影響の説明共有、簡潔なドキュメント作成、プロダクトマネージャ・エンジニアチーム・Bizチームとの業務目標連携共有が求められます。

    • 率先した課題の発見とメトリクス提供による業務貢献

  • 🔍 専門領域ごとの追加事項:

    • ✈️ 航空業界:気象地理学、ATC(航空交通管制システム)、軌道予測などの専門知見。

      ※ PIML(物理法則を組み込んだ機械学習)の専門性があると専門人材として重宝されますよ。

    • ⚙️ 製造業:OCR(光学文字認識)、画像データ抽出、3Dジオメトリ、製造コストの回収計画、予想外の業界動向データ処理などの専門知識。

    • 📈 コミュニティ管理・CRM分野:推奨システム、グラフ統計、顧客ネットワーク分析、顧客エンゲージメントメトリクス、LLM駆動ツールの専門性。

    • 🔐 SaaSセキュリティ領域:アクセス権限管理、大規模なアクセスログ分析の実施、マルチテナントにおけるデータガバナンスに関する経験知識。

語学スキルと勤務条件:

  • 🌍 語学スキルを活かしたい方へ:外資系企業またはスタートアップ事業では、バイリンガル人材の募集も盛んです。専門分野の知識を用いたステークホルダーとのヒアリングなどが日英両方でこなせると、さらなるキャリアや給与アップが目指せますよ。

  • 🏢 就業場所:ハイブッド勤務またはリモートワークの可能な求人が多めです。オフサイト勤務を導入している企業もありますよ。

  • 🕰️ 就業時間:フレックス勤務が多い印象です。(正午近く〜夕方までのコアタイムあり)

また、オフィス内に集中ブースなどの特設スペースが設けられているケースも増えてきています。

🗣️ 選考段階の流れ:

  • カジュアル面談と一次面接:企業文化とのマッチング、志望動機、今後のキャリア方針などを協議します。

  • 技術面談(コーディングテスト、実技試験など):部署間連携の多い役職柄、複雑な技術力アピールよりも業務における協調性がみられることが多いです。

  • 二次面接:前職経験や製品化対応でのトレードオフ、システム設計、MLOpsなど、専門性に踏み込んだ議論が行われます。弊社では、面接準備も日英両言語でサポートいたします。

  • 最終面接:役員メンバーまたはCTOと実施。

  • 内定通知:おめでとうございます!🙌

👂 面接の耳より情報:

機械学習を用いた製品化の経験、数値測定・KPI設定、信頼性に問題のあるデータの業務対応経験などが、重要な判断材料になります。業務レポートやE2Eパイプラインの構造図を持参するのがオススメです。企業側に皆さんのプロとしての腕や実績をしっかりアピールしてくださいね。

📝 応募書類の形式と書き方のとっておき情報

📄 形式のヒント:

  • 必要書類の確認:日系企業へのご応募は履歴書や職務経歴書、外資系企業へのご応募はCV(英語)が求められます。

  • テンプレートのご案内:日系企業用の履歴書職務経歴書外資系企業用のCV、それぞれ無料テンプレートをご用意しております。ダウンロードの上、ご活用いただけますと幸いです。

  • 注意点:日系書類では「フォーマット管理力」、外資系書類では「応募先に合わせた経歴の要約能力」が見られる傾向があります。応募書類のチェックなども、お気軽にご相談ください。

✍ 書き方のヒント:

ここでは、効果的に応募書類を作成するヒントをご紹介いたします。

  • 製品化対応と実績の明記:コスト削減割合やレイテンシ削減時間を明記してください。(例:製品への新規デプロイによるコスト○%削減、メトリクス○の○%改善に伴うレイテンシ○秒削減)

  • データパスの記載:データソース、データラベリング、アノテーション戦略、実装機能、データモデル情報、評価集計、デプロイ詳細、デプロイ後の監視などの段階も記載してください。

  • 専門領域の強み:各ポジションで求められる専門領域の知識があれば、企業側への訴求力も格段にアップしますよ。

    例:航空業界の制約事項、 想定外のCADジオメトリデータ処理、マルチテナント分析、顧客エンゲージメント・顧客レコメンデーションなど

🌍 バイリンガルポジションに応募される方へ、

  • 言語スキル:複数言語での業務経験を記載するのがオススメです。「グローバルプロジェクト担当」、「日英両言語での折衝・協業経験」など実際の業務内容を記載してください。外資系企業を中心に、実務経験の有無が判断材料になる傾向があります。

ここからは、データサイエンティスト職についてのよくあるご質問をご紹介いたします。

🌍 語学スキルを活かした業務経験は積めますか?

もちろんです。外資系企業やスタートアップ企業を中心に、バイリンガル求人も盛んです。

データ処理に関する専門性と実際の業務で関わる専門領域知識の両方が必要なポジションです。日本語と英語で知識のアップデート・比較を習慣づけると、新たなキャリアでの順調なスタートにつながりますよ。

※🤫 「英語は…」な方へ。

弊社では、日本語業務の求人もご紹介しております。

ですが、もし将来的にチャレンジしてみたいという方は、こちらのブログで「外資系で働く英語力」をご紹介しております。また、近日英語のスキルアップ方法も別ブログにてアップする予定です。お楽しみに!

💰 ズバリ平均年収が知りたいです!

  • ジュニア〜ミドルレベル:500万〜750万円

  • シニア〜プリンシパルレベル:850万〜1,320万円

💪給与アップのポイント:プロダクション環境の機械学習(API連携・バッチ処理)、パイプライン管理、プロダクト評価KPIの設定がこなせれば、各レベルでの上位年収に近づくことができます。また、スタートアップ事業では、ストックオプション制度が導入されていることもあります。

💪 特に重要なスキルが知りたいです!

以下の4つのスキルを満遍なく磨くことが重要です。

  1. SQL

  2. Python

  3. クラウドツールスキル(AWS・Google Cloud)

  4. コンテナツールスキル(Docker)

また、実際の業務では、E2Eの製品オーナーシップが問われます。以下の6つの業務が担当できる人材が重宝されます。

  • データ統合・ELT

  • モデル構築

  • デプロイ(FastAPI・AWS Lambda・Cloud Runを使用)

  • データドリフト・レイテンシ・コストの監視

  • イテレーションの実行によるプロダクト評価KPI

❓ キャリアがデータサイエンティスト寄りです。機械学習エンジニア関連の経験がないことが不利に働きますか?

機械学習エンジニア経験は必須項目ではありません。ポイントは、「顧客のもとまで製品を送り届けられるか」です。

以下のポートフォリオの作成がオススメです。

  • API連携・コンテナ運用能力・バッチ処理を含む小規模な製品デモ

  • 監視・イテレーションの報告書

業務プラットフォームツールやMLOpsのスキルをしっかりとアピールしていきましょう!

🧰 実際の業務に求められる技術スタックが知りたいです!

以下で、詳しくご紹介いたします。

各業界共通

  • プログラミング言語:Python

  • 機械学習フレームワーク:PyTorch、scikit-learn、LightGBMのいずれか

業務内容に応じて使用

  • データ管理ツール:BigQuery、Amazon Redshift、PostgreSQLのいずれかとdbtまたはETL

  • サーバーツール:FastAPI、バックエンドTypeScript、Docker、GitHub Actions(CLツール)

  • インフラストラクチャーツール:AWSサービスまたはGoogle Cloudサービスのいずれかが一般的です。

    • AWSサービス:Amazon Lambda、Amazon Gateway、Amazon DynamoDB) 

    • Google Cloudサービス:Vertex AI、Google Kubernetes Engine(GKE)、Kubeflow

👔 各ポジションにおける実際の業務内容を知りたいです!

専門領域や業界に応じて、業務内容が多岐にわたるポジションです。ただ、全体的に共通することは、「データ信頼性を担保しつつ、レイテンシ・コスト・ユーザーエクスペリエンス・セキュリティにおける製品パフォーマンスを上げる業務」だということです。

また、データサイエンティストとして携わる専門業界ごとに制約スキルが加わる点もポイントです。

例)✈️ 航空業界(フライトオペレーションに関わる天候・地理・気象要素)、⚙️ 製造業(CAD・3Dツールスキル)、📈 コミュニティ管理・CRM分野(顧客エンゲージメント知識・評価スキル)、🔐 SaaS領域(アクセスログ管理)


ベンチマーク指標やデータとの睨めっこでは終わらないのが、「データサイエンティスト」です。

🗣️ 選考プロセスが知りたいです!

主な選考プロセスは、以下の通りです。

  1. 書類審査

  2. 技術面接(コーディングテストまたは在宅課題)

  3. 面接選考(モデル構築・MLOps・システム設計の経験スキル共有)

  4. 最終面接(企業文化との兼ね合い・取締役面談)

また、選考の中では、技術決定に伴うトレードオフや故障モード、プロダクション環境での成功評価基準などが議論になります。しっかりと準備をして望みましょう。また、前職で使用したE2Eパイプラインの構造図を持参するのもオススメです。

📝 応募書類の書き方に自信がないです…。

重要ポイントをサクッとお伝えいたします。

  • 数値化アピール:コスト削減割合やレイテンシ削減時間を明記してください。

  • 製品化対応のまとめ作成:インフラストラクチャー、CI、監視、ロールバックなどの対応経験を一項目にまとめておきましょう。

  • 担当業界の専門知識:データ管理の専門スキルだけでなく、業界関連の知識をまとめてください。(例:航空業界・CADスキル・推薦システム・SaaSセキュリティなど)

他にも気になる方は、是非、弊社にご相談ください。


💻 LLMの業務活用はありますか?LLMがハイプ(過大評価)されているだけですか?

ユーザーエクスペリエンスや業務効率の向上に向けて、LLMの実用化が進んでいます。中でも、コンテンツ提案、要約作成、社内ツール化などでの導入が盛んです。しかしながら、レイテンシ・コスト管理には、基準となる評価数値の設定や指標策定が完了していない現場もまだまだ多い状況です。

評価診断、パイプラインの迅速化、情報抽出のスキルをしっかりとアピールしましょう。実務の中で機械学習とLLMの効果的な使い方を見極め、場面ごとに併用できるようになるのがおすすめです。

🎯 募集が盛んな業界・領域が知りたいです!

注目の領域と各業界の重要スキルをご紹介いたします。

  • 📷 マシンビジョン・3D・CAD領域:OCR、類似検索、データノイズ除去、ジオメトリ

  • ⌚️ 業務効率化領域: 時系列分析、予測分析、PIML(物理法則を組み込んだ機械学習)

  • 📈 顧客コミュニティ・CRM領域:推薦システム、顧客エンゲージメント評価分析、グラフ統計

  • 🔐 マルチタレントSaaS領域:SaaSセキュリティ診断、アクセスログ分析

🏢 「リモートワーク求人」でも、勤務場所の制約はありますか?

コアタイムありのハイブリッド勤務求人が多い印象です。リモートワーク可能でも、全社的な既定出社日、外勤日、取引先との訪問面談などがあります。フルリモート勤務の場合は、業務成果物の信頼性を担保することが重要です。ダッシュボード、Readmeファイル、ログデータのシームレスなアップデートを心がけるのがおすすめです。


🗣️面接選考で業績をアピールするコツはありますか?

E2Eの業務対応体験」が効果的です。業務の目標や制約(レガシーシステム、SLA、業務予算)、データ戦略、モデル策定の決め手、導き出された傾向予測、用いたメトリクスや実施したイテレーションなどを面接の場で説明しましょう。パイプライン構造図や業務成果をスライドやA4サイズ1枚程度にまとめて持参すると非常に効果的です。

🧑‍🎓 アカデミアやKaggle(オンライン学習)からの転職は?

leaderboardや研究に費やす意欲とストイックさを製品クオリティに活かしましょう。レイテンシ改善、SLAの定義、失敗対応、価格設定、業務における「完了の定義」が力の見せ所です。監視機能やロールバック機能を実装したモデルに対応したサンプルアプリを構築・フォークしておくと転職時に役立ちますよ。


🌐 文章公開やOSコントリビューションは、業績になりますか?

もちろんです!製品化された場合やシステム思考が体現化されている場合は、評価対象になります。とはいえ、「製品リリース」や「顧客エンゲージメント向上」といった実務実績が優先されます。製品開発シナリオと関連づけて説明できるようにしていきましょう。

☑ 業績評価対象には何がありますか?

ズバリ「売り上げ貢献とデータの信頼性」です。具体的には、KPIの達成率、コスト削減、リリースにおけるリスク回避、新規機能実装への貢献などが評価対象項目になります。コーディングやドキュメント作成、コメントの信頼性も重要です。他方、部署間連携に貢献できる人材を求める企業が多い印象です。業務の中で、テンプレート作成、ライブラリ構築、データコントラクト管理も担当になるかもしれません。

💦 SaaS事業やIT業界データ管理で大変なポイントはありますか?

マルチテナントにおけるスキーム分離、新たなデータトラッキング方法のアップデート、アクセス権限管理、アノテーションの品質管理、ハードウェアによる制約、エッジ制約などの業務で手腕が試されます。データコントトラクトを提示しながら、検証、バックフィル管理を行うのが重要です。機能フラグを使用したインクリメンタルロールアウトを実施しましょう。


✨ データサイエンティスト職の魅力的なポイントが知りたいです!

高い給与水準に加えて、高待遇求人が多いのもおすすめのポイントです。

具体的には、潤沢な学習予算によるスキルアップ機会の充実、高スペックPCの貸与、ストックオプション制度(スタートアップ企業がメイン)、子育て支援制度、各種健康診断、技術スキル向上に向けたテックトーク・グループリーディングが実施されています。より製品制作に意欲のある方は、MLOps・社内システムツールへの投資見解・データ品質やアノテーション品質にかける予算配分について面接時に質問してみましょう。

🕰️ 平均的な残業時間が知りたいです!

正直に申し上げますと、各社・担当製品ごとにリリースサイクルに応じた変動があります。面接時の逆質問で尋ねるのが、一番確実です。

👇実際の業務感を掴める逆質問項目をご用意しました。是非、チェックしてみてくださいね。

オンコール勤務の有無、インシデント対応数、ホットフィックス配布対応の流れ、製品実験による製品リリースへの影響

自分で聞くには…、という方は、お気軽にご相談ください。

🧭 将来的なキャリアアッププランには、どんな方向性がありますか?

主なキャリアアッププランをご紹介いたします。

どのポジションでも技術職としての専門性とステークホルダーの信頼を得られる人柄が重視されます。

  • データサイエンティスト職(シニアレベル・プリンシパルレベル)または機械学習エンジニア職として習熟度をあげる。

  • テックリード職または機械学習プラットフォームエンジニア職を経験。

  • ドメインエキスパート職(画像・3D解析、予測分析、推薦システムがおすすめです)として専門領域に磨きをかける。

  • アーキテクト職またはテクニカルプロジェクトマネジメント職へ就任。

👀 ポートフォリオの最終チェック項目が知りたいです!

サクッと、この4項目を一緒に確認していきましょう。

  • 製品としてリリースしたプロジェクト情報は記載されていますか?報告書、簡単な製品デモ、構造図をセットで提出するのがおすすめです。

  • READMEの可読性はどうですか?完成後に一呼吸おいて、再読・推敲してみましょう。

  • テストやCIの概要、簡単な評価基準は記載されていますか?

  • 業務を通した「学び」は記載されていますか?端的に表現する文章力からも、イテレーション工程の習熟度を示すことができますよ。

💪 未来は、ここから!

こちらのリンクより、お気軽にお問い合わせください。都内で現在募集中のポジションを弊社よりご紹介いたします。

Next
Next

Go Global Hub 第6回 イベント紹介〜世界へ羽ばたく準備とは? スタートアップの道標〜