Integral Ad Science の Paulo da Costa 氏が、データ サイエンティストとしての日々の役割と、小さく始めることの重要性を過小評価してはいけない理由について説明します。
Paulo da Costa 氏は Integral Ad Science のスタッフ データ サイエンティストで、コンピューター ビジョン、自然言語処理、音声処理の技術を組み合わせて、動画コンテンツに重点を置いた広告検証と最適化のモデルを作成しています。
da Costa の典型的な 1 日は、プロジェクトの進行状況とスケジュール、およびコードの作成、論文のレビュー、コード評価に割り当てられた時間について話し合うチーム アップデートから始まります。日中や週を通してさらに多くのチーム ミーティングが行われ、戦略と目標が評価され、必要に応じて調整および修正されます。
「仕事量を効果的に管理するために、タスクを管理しやすいサイズに分割し、説明責任と時間管理のためにカレンダーにブロックするなどの戦略を採用しています」とダ コスタ氏は言います。
「全体的に、チームワーク、問題解決、ステークホルダー管理、アイデアのテスト、個人の成長が融合し、適度なコーヒーブレイクも散りばめられた、毎日が少しずつ違った展開になります。」
現在、私のプロジェクトのほとんどは、マルチメディアや動画コンテンツへのディープラーニングの利用を中心に展開しています。その幅広い領域で、特定のユースケースに合わせたさまざまなアーキテクチャや学習目標に取り組んでいます。たとえば、教師あり学習を活用した検出モデルの開発、動画を効率的に分類するための情報検索アプローチの開発、人間による注釈付きデータなしで有用な表現を学習するための自己教師の使用などが考えられます。特に、視覚やテキストなどのさまざまなモダリティを組み合わせて、人間と同じように多様なデータ信号を処理できるより優れたモデルを作成するなど、マルチモダリティに関する取り組みは楽しいです。
私の役割では、大量のデータの処理からアルゴリズム開発のさらなる深掘りまで、さまざまなタスクに没頭しています。その日の焦点が何であれ、データ エンジニアリング、モデルの製品化、機械学習 (ML) の課題への取り組みなど、アルゴリズム思考は最も重要です。
適応性は、特に使用するツールに関しては重要です。データ処理に Spark や SQL を活用することから、モデル開発に TensorFlow や PyTorch などの Python ライブラリを活用することまで、汎用性は不可欠です。さらに、優れたソフトウェア開発スキルがあれば、私が書いたコードは機能的であるだけでなく、保守可能で同僚がアクセスしやすいものになります。
コンピュータ サイエンス、数学、統計の強固な基礎を築くことは、増え続けるツールやテクノロジーをうまく使いこなすために不可欠です。ソフト面では、人材管理スキルも同様に重要な役割を果たします。効果的なコミュニケーション、リーダーシップ、チームの成長と関与の促進は見落とされがちですが、この分野で成功するには不可欠です。
AI と ML の分野は急速に進化しているため、最新の開発についていくのは困難です。効果的なコミュニケーションは、特に複雑な概念を扱う場合には、もう 1 つの基礎となります。アイデアを明確かつ簡潔に表現し、多様なチームとのスムーズなコラボレーションを確保することが難しい場合があります。私の仕事の大部分は集中力を必要とします。接続されたデバイスやツールが大量にあるため、気を散らすものを最小限に抑え、集中して作業するための時間を確保するのは非常に困難です。
これらの課題に対処するために、私は独自の戦略を持っています。まず、タスクに優先順位を付け、明確な境界を設定して、目標を達成するために必要な時間とリソースを確保します。また、より効率的で効果的なコミュニケーションのために、取り組んでいるプロジェクトに関する文書も保管しています。さらに、ソーシャル メディアの使用を意識的に制限し、最近の研究を調べ、分野の進歩に関する情報を得ることに時間を費やして、最新の開発状況を把握するよう最善を尽くしています。
私は定期的に休憩を取り、水分を補給し、可能な限り十分な休息を取るように努めています。身体を動かすことはストレスを軽減し、セルフケアを優先させるのに役立つと信じています。
私は、明確な目標と優先順位を設定することから一日を始めるようにしています。注意を払う必要がある最も重要なタスクを特定し、最初にそれに集中します。さらに、可能な限り、繰り返しのタスクを自動化するようにしています。最初は時間がかかるかもしれませんが、将来の自分はきっと感謝してくれるでしょう。
同僚との日々のコミュニケーションには、仕事関連のやり取りと社交的なやり取りが混在しています。Slack は、同僚とのリアルタイム コミュニケーションの主なツールです。仕事関連の議論、プロジェクトの最新情報の共有、チーム メンバーとの調整には Slack チャンネルを使用しています。プロジェクト管理ツールとして Jira を使用しています。これは、タスクの追跡と割り当て、ステータスの追跡、プロジェクト要件に基づく作業の優先順位付けに役立ちます。バージョン管理は、AI プロジェクトの共同開発にも重要で、チーム全体でコード変更をシームレスに統合します。さらに、当社の従業員は世界中にいるので、会議や共同ディスカッションにはビデオ会議を頻繁に使用しています。
「成功には、多くの場合、複数の試みと時折の挫折が伴う」
ディープラーニング、特に BERT や GPT などのトランスフォーマーベースのモデルの登場により、自然言語処理やコンピューター ビジョンなどのタスクへのアプローチ方法に顕著な変化が起こりました。
この変化には、モデルのトレーニングに必要なデータ量の変化が含まれ、より大きなモデルにより多くのデータを供給することで、パフォーマンスが大幅に向上することが示されています。これらの進歩により、ハードウェア (GPU、TPU) とソフトウェア (TensorFlow、PyTorch) の両方が急速に進歩し、より大規模なモデルとより複雑なアーキテクチャでの実験が可能になり、さまざまな分野でブレークスルーが推進されています。
同時に、スケーラビリティと効率性は今日の状況、特にリアルタイムの意思決定において重要であり、分散トレーニング技術、モデル圧縮、リソースが限られたデバイス向けの展開方法の開発が促進されています。さらに、AI の使用が増えるにつれて、データのプライバシーとアルゴリズムの説明責任に関する懸念が高まり、より透明性の高い AI システムを作成するための取り組みが増加しています。
AI/アナリティクス分野で働くことで私が最も充実感を感じるのは、現実世界の課題を解決し、興味深い問題に取り組む機会があることです。テクノロジー自体も魅力的ですが、私が本当にやりがいを感じるのは、その実用化とそれがもたらす具体的な影響を目の当たりにすることです。
革新的なソリューションを発見し、それがもたらす良い結果を観察することが、日々の私のモチベーションの源です。さらに、私はコラボレーションとチームワークの力を非常に高く評価しています。他の人と一緒に働くことで、専門知識と視点を組み合わせることができ、最終的にはさらに優れたソリューションにつながります。
継続的な学習に専念し、新たな課題や知識のギャップに直面しても謙虚な姿勢を保ってください。この分野は広大で急速に進化しているため、強固な基盤と学習意欲の組み合わせが重要になります。
新しいプロジェクトや課題に取り組むことを恐れないでください。自分の分野内外を問わず、他の人と協力して、多様な視点や異なる考え方を獲得してください。さまざまなチームで働くことで、より革新的なソリューションや個人の成長につながることがよくあります。いつ宝物が見つかるかはわかりません。
成功には、多くの場合、複数の試行と時折の挫折が伴うことを理解してください。AI と分析の分野では、結果を達成することと同じくらい実験が重要です。不確実性を受け入れ、曖昧さを乗り越えることに慣れるようにしてください。
小さく始めることの重要性を過小評価しないでください。初心者は、より単純なベースラインを確立せずに複雑なモデルに飛びつくことがよくあります。必要なときに単純化することで、明確さが得られ、より効果的で堅牢なソリューションへの道が開かれます。
新しいポッドキャスト「Future Human: The Series」で、新たなテクノロジートレンドが明日をどう変えるのかをご覧ください。Spotify、Apple、またはポッドキャストを入手できる場所で今すぐお聴きください。
詳細: Integral Ad Science での 1 日の生活
関連: AI、雇用主、Integral Ad Science、職業生活、データ、データサイエンス、分析
シリコンリパブリックの重要な科学技術ニュースを毎日お届けするデイリーブリーフにご登録ください。
元記事: https://www.siliconrepublic.com/people/integral-ad-science-data-science-ai-analytics