wooheum

### 1. **理由** - **日本語の特殊性への対応**: 日本語は他の言語と比べて文脈依存性が高く、敬語やニュアンスの違いが複雑です。現状のLLMは英語を中心に開発されているため、日本語の特性を十分に反映したモデルが少ないです。最高性能の日本語LLMを作ることで、日本語の微妙なニュアンスや文化的背景を理解できるAIを実現したいと考えています。 - **社会課題の解決**: 日本語LLMが高度化することで、医療、教育、法律など専門性の高い分野での活用が進みます。例えば、医療現場での診断支援や、教育現場での個別指導、法律文書の自動解析など、社会課題の解決に貢献できる可能性があります。 - **日本の技術競争力向上**: 世界的にAI技術が進化する中で、日本発の技術が国際的に競争力を維持するためには、日本語に特化した高性能LLMの開発が不可欠です。これにより、日本がAI分野でリーダーシップを発揮できる基盤を作りたいと考えています。 ### 2. **具体的な取り組み** - **日本語コーパスの拡充**: 高品質な日本語データセットを構築し、モデルの学習に活用します。特に、専門分野のテキストや多様な方言、歴史的文書などを含めることで、幅広い文脈に対応できるモデルを目指します。 - **文化・文脈理解の強化**: 日本語の敬語やニュアンス、文化的背景を理解するためのアルゴリズムを開発します。例えば、同じ単語でも文脈によって意味が変わる場合や、話者の立場によって言葉遣いが変わる場合に対応できるようにします。 - **マルチモーダル対応**: テキストだけでなく、音声や画像も含めたマルチモーダルな日本語LLMを開発します。これにより、音声認識や画像解析との連携が可能になり、より自然な形でのコミュニケーションが実現できます。 - **倫理的な配慮**: 日本語LLMが偏見や差別的な表現を生成しないよう、倫理的なガイドラインを設け、モデルの学習段階から適切なフィルタリングを行います。 ### 3. **実現したい未来** - **誰もが使いやすいAI**: 日本語LLMが高度化することで、高齢者やITに不慣れな人でも簡単にAIを活用できる環境を整えたいです。例えば、音声での自然な会話を通じて、日常生活のサポートや情報提供ができるAIを目指します。 - **国際的な貢献**: 日本語LLMの技術を応用し、他の言語や文化圏でも活用できる汎用的なAI技術を開発することで、国際社会に貢献したいと考えています。この目標を実現するためには、技術的な挑戦だけでなく、倫理的な課題や社会との連携も重要です。3〜5年後には、日本語LLMが社会のさまざまな場面で活用され、人々の生活を豊かにする存在になっていることを目指しています。

プロジェクト経験

2024年/1年以内

AWSを活用した生成AIプロダクトの開発

プロジェクトカテゴリ

：webサービス / 自社プロダクト

担当工程

経験した職種・役割

あなたが実際に使っていた技術

## プロジェクト経験 ### 1. Retrieval-Augmented Generation（RAG）を活用した情報検索システムの構築 **プロジェクト概要** 大規模言語モデル（LLM）を活用し、企業向けの安全な情報検索システムを構築。ナイーブRAG、モジュラーRAG、グラフRAGなどの技術を組み合わせ、ユーザーのクエリに対して適切な情報を提供するシステムを開発。 **チーム情報** - プロジェクトマネージャー：1名 - バックエンドエンジニア：2名 - フロントエンドエンジニア（自分）：1名 - AIエンジニア（自分）：1名 **課題** - 従来の検索システムでは、関連性の高い情報を取得するのが難しく、適切な回答が得られないことが多かった。 - ユーザーが意図した内容と異なる回答が生成されるリスクがあった。 - モデルの精度と応答速度を両立させる必要があった。 **工夫** - Retrieval-Augmented Generation（RAG）の手法を採用し、検索精度を向上。 - Naive RAG、Advanced RAG、Modular RAG、Graph RAGなどの手法を比較し、最適なアプローチを決定。 - AWS BedrockとSageMakerを利用し、クラウド上でのデプロイメントを最適化。 - OpenAI APIと自社データを組み合わせたハイブリッド検索モデルを構築。 - Python（FastAPI）を用いたバックエンド開発、Next.jsを用いたフロントエンドの実装。 **成果** - 従来の検索システムと比較して、情報の精度が約30%向上。 - クエリ処理時間を1.5秒以内に抑えることに成功。 - ユーザーからのフィードバックをもとに継続的な改善が可能なシステムを構築。 --- ### 2. AWSを活用した生成AIプロダクトの開発 **プロジェクト概要** 生成AIを活用したプロダクト開発を行い、LLMのチューニングやデプロイ環境の最適化を実施。AWS BedrockやSageMakerを活用し、クラウド上での生成AIシステムを構築。 **チーム情報** - プロジェクトマネージャー：1名 - AIエンジニア（自分）：1名 - クラウドエンジニア：1名 **課題** - 生成AIの応答速度が遅く、リアルタイム性のあるシステムを提供するのが困難だった。 - クラウド環境でのコスト最適化が求められた。 - モデルのチューニングに時間がかかり、パフォーマンスを向上させる必要があった。 **工夫** - AWS BedrockとSageMakerを活用し、推論最適化を実施。 - モデルのLoRA（Low-Rank Adaptation）やSFT（Supervised Fine-Tuning）を実施し、特定タスクへの適応度を向上。 - AWS LambdaとStep Functionsを組み合わせ、コスト最適化を実施。 - モデルの動作状況をリアルタイムでモニタリングし、改善点を即座にフィードバック。 **成果** - 推論時間を平均40%削減し、リアルタイム処理の実現に成功。 - クラウドコストを約25%削減。 - モデルの精度向上により、ユーザー満足度が向上。 --- ### 3. React（Next.js）を活用したWeb開発 **プロジェクト概要** 生成AIの出力をユーザー向けに可視化するためのフロントエンド開発を担当。Next.jsを活用し、直感的で操作しやすいUIを設計。 **チーム情報** - プロジェクトマネージャー：1名 - フロントエンドエンジニア（自分）：1名 - バックエンドエンジニア：2名 **課題** - 生成AIの出力を適切に整理し、ユーザーが理解しやすい形で表示する必要があった。 - APIレスポンスの遅延を考慮したフロントエンド設計が求められた。 **工夫** - React（Next.js）を使用し、サーバーサイドレンダリング（SSR）を活用することで、パフォーマンスを最適化。 - Tailwind CSSを導入し、デザインの一貫性と開発スピードを向上。 - SWR（stale-while-revalidate）を用いて、データフェッチの最適化を実施。 - AWS AmplifyやVercelを活用し、CI/CD環境を整備。 **成果** - フロントエンドのパフォーマンスが向上し、ロード時間を平均30%削減。 - ユーザーのエンゲージメントが向上し、プロダクトの利用率が増加。 - デプロイの自動化により、開発スピードが向上。

2025年/3ヶ月以内

Siri Understanding

プロジェクトカテゴリ

：自社プロダクト

担当工程

経験した職種・役割

あなたが実際に使っていた技術

### **プロジェクト経験概要** Apple Japanにて、Siriの韓国語自然言語理解（NLU）および音声処理（TTS、ASR）に関するプロジェクトに従事しました。具体的には、韓国語に特化した言語モデルの改善や、データ駆動型の手法を用いた精度向上、パフォーマンス最適化を担当しました。 --- ### **チーム情報** - **チーム規模**: 10名程度 - **自身の役割**: - 韓国語NLUのモデル開発・最適化 - データ分析・改善提案 - モデルのパフォーマンス評価・デバッグ --- ### **開発・実装内容①: 韓国語NLUの精度向上** #### **【概要】** Siriの韓国語理解力を向上させるため、言語モデルをFine-tuningし、特定のユースケースに最適化。 #### **【課題・問題点】** - 既存モデルでは韓国語特有の表現（助詞の省略、語順の変化）を適切に処理できないケースが多発。 - ユーザーの発話意図を正確に分類できない問題が発生（特に曖昧な質問への対応が不十分）。 #### **【打ち手・使用した技術】** - **言語モデルをFine-tuning** - 事前学習済みの言語モデルを使用し、Siriのユースケースに特化したデータで再学習。 - **データの拡張とクリーニング** - エラー解析を行い、アノテーションの精度を向上。 - Data Augmentationを適用し、多様な言い回しを学習。 #### **【成果】** - 発話意図分類の精度が約10%向上（F1スコア 83% → 91%）。 - エラー率の低減により、ユーザーの音声認識後の誤解釈が大幅に減少。 - 韓国語の特性を考慮したモデル調整により、実際のユーザー満足度調査でも肯定的なフィードバックが増加。 --- ### **開発・実装内容②: 音声合成(TTS)の品質向上** #### **【概要】** 韓国語の音声合成エンジンの改良を担当し、より自然な発話ができるようTTSモデルを最適化。 #### **【課題・問題点】** - 既存のTTSモデルでは、イントネーションの不自然さが課題となっていた。 - 特に抑揚や長音の表現が不自然で、ユーザー体験に悪影響を与えていた。 #### **【打ち手・使用した技術】** - **音声合成モデルの再学習** - 韓国語の音韻的特徴に適したプロソディ調整を実施。 - データ収集を強化し、より多様な発話パターンを学習。 #### **【成果】** - 韓国語TTSの音声自然度評価（MOSスコア）が4.2 → 4.7に向上。 - 特に長音や抑揚の精度が向上し、ユーザー満足度が改善。 - 処理時間の最適化により、音声生成の遅延が約30%削減。 --- ### **思考プロセスの補足** - 課題の発見: 実際のユーザーデータを分析し、誤認識のパターンを特定。 - アプローチの選定: 既存のモデルを改良するか、新しいアーキテクチャを採用するかを評価。 - 実装と評価: 定量的な指標（F1スコア、MOSスコア、処理速度など）を用いて改善を測定。 - フィードバックの活用: 他のエンジニアやデータサイエンティストと連携し、継続的にモデルを改善。

アピール項目

アウトプット

GitHub アカウント

未入力です

Qiita アカウント

未入力です

Zenn アカウント

あり

Speaker Deck アカウント

未入力です

SlideShare アカウント

未入力です

特にアピールしたいアウトプット

あり

今後、身につけなければいけないと思っている技術は何ですか？

### **1. 生成AIとLLMの応用技術** 現在の業務でも関わっていますが、より高度なLLMのファインチューニングや、効率的な推論技術（LoRA、QLoRA、MoEなど）を深く学び、独自のモデルを最適化・運用できるスキルを強化したいです。また、マルチモーダルAI（テキスト＋画像、音声）にも興味があります。 ### **2. MLOpsとデータパイプライン** 機械学習モデルを本番環境で安定運用するための技術として、MLOpsの知識（AWS SageMaker、Kubeflow、MLflowなど）を深めたいです。特に、データの収集・処理・モデルのデプロイまでのパイプライン構築をスムーズに行えるようになりたいと考えています。 ### **3. クラウドネイティブなシステム設計** 現在AWSを活用した開発経験がありますが、よりクラウドネイティブな設計（Serverless、Kubernetes、Microservicesアーキテクチャなど）を実践的に学び、スケーラブルなシステム構築ができるようになりたいです。 ### **4. フロントエンド・バックエンドの技術強化（特にRust & WASM）** Next.jsやTypeScriptを活用したWeb開発経験はありますが、よりパフォーマンスを求められるシステムのために**Rust & WebAssembly（WASM）**を学び、フロントエンド・バックエンドの最適化を行うスキルを身につけたいです。 ### **5. 数理最適化・強化学習の応用** 機械学習だけでなく、数理最適化（ORツール、Gurobi、Google OR-Tools）や強化学習（RLHFなど）を組み合わせて、より高度な問題解決を行えるようになりたいです。これらの技術を身につけることで、エンジニアとしての価値を高めるだけでなく、より実用的でインパクトのあるプロジェクトに貢献できるようになりたいと思っています。

あなたが一番パフォーマンスを出せるのはどんな環境ですか？

- 自由に動けるところ

キャラクター

直近で一番やりたいこと

サービスを作りたい

好きなスタイル

好きな規模

自信を持って人より秀でていると言える点

学習能力 / 問題解決力 / 人を集める力

スキルのタイプ

得意なフェーズ

会社を選ぶ一番の基準

風通しの良さや意思決定ライン

やりたくない分野

その他の特徴

未入力です

その他のやりたいこと・やりたくないこと

未入力です

やりたい事

手を動かして設計してコードを書きたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

価値あるプロダクトを作り成長させたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

学び続けて技術力でプロダクトに貢献したい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

意義があることや社会に貢献できる仕事がしたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

人や計画の調整・マネジメントをしたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

レガシーなシステムの保守・運用・改善をしたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

企画や仕様を考えるところから関わりたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

業務効率を改善して一緒に働く人のためになりたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

全社横断的な共通基盤作りや強化をしたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

組織や文化を作る・成長させる仕事をしたい

絶対やりたくない

あまりやりたくない

別に普通

やりたい

絶対やりたい

基本プロフィール

年齢

今年で20代後半

好きなテキストエディタ

VIM

希望勤務地

東京都 / 神奈川県 / リモート勤務

家庭の事情や体調など、都合に合わせてリモート出来れば問題ない

希望年収

未入力

要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。

なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。

{{error}}

投函する

ご意見を記載してください投函する

プロフィール

公開用ネーム

wooheum

年代

今年で20代後半

好きなテキストエディタ

VIM

参加状況

参加ステータス

不参加

参加回数

1回

累計平均提示年収

754 万円

このユーザーがどんな人か見る

wooheum

2025年3月回指名

3年後の目標や野望

プロジェクト経験

AWSを活用した生成AIプロダクトの開発

Siri Understanding

マネージメント能力

アピール項目

アウトプット

今後、身につけなければいけないと思っている技術は何ですか？

あなたが一番パフォーマンスを出せるのはどんな環境ですか？

キャラクター

やりたい事

基本プロフィール

転職ドラフトを友人や同僚に薦める可能性はどのくらいありますか？

wooheum

2025年3月回 指名

3年後の目標や野望

プロジェクト経験

AWSを活用した生成AIプロダクトの開発

Siri Understanding

マネージメント能力

アピール項目

アウトプット

今後、身につけなければいけないと思っている技術は何ですか？

あなたが一番パフォーマンスを出せるのはどんな環境ですか？

キャラクター

やりたい事

基本プロフィール

転職ドラフトを友人や同僚に薦める可能性はどのくらいありますか？

2025年3月回指名