ID:64068さん

3年後の目標や野望


機械学習を主としたフルスタックエンジニアとして活躍したい

自分専門領域であるNLPだけではなく、様々な方面技術にもキャッチアップし続けていきたいです。 何か実現したいシステムがあった時には逐一学習を進めるのではなく、即座に実現向けて動けるように選択肢の幅を増やす。

年収評価シート

2021年/半年以内

テキスト音声合成システムにおける句境界予測モデルの研究開発

# プロジェクト概要 ## テキスト音声合成システムについて テキスト音声合成システムとは、テキストから人工的な音声を作り出す技術です。入力として与えられるテキストからテキストの内容を反映した人工的な音声発話を出力します。AppleのSiri、AmazonのAlexaなどに代表される活用される技術で、LINE CLOVAにも活用される技術です。 一般的なテキスト音声合成システムは言語処理部、音響モデル、ボコーダーの3つのモジュールから構成されます。 1つめの言語処理部では、日本語テキストから音声の言語的な情報を表す言語特徴量を作成します。テキストから自然な合成音声を生成するにあたって、言語処理部では言語依存のテキスト正規化、音素系列への変換、アクセント位置の予測、音声的なポーズ位置の予測など数多くの処理が行われます。このような様々な処理によって抽出される言語特徴量の品質により、合成音声の品質が大きく左右されます。 例えば、「朝の空気は爽やかです。」という生テキストを言語処理部によって「asano kuukiha / sa wayaka desu.」のような表記から構成される言語特徴量へと変換します。この言語特徴量は、音素系列から構成され、赤字をアクセント、'/'記号の位置をポーズ位置として表しています。 2つめは音響モデルです。音響モデルでは、言語処理部によって作成された言語特徴量を音響特徴量へと変換します。音響特徴量とは音声の音響的な情報を表す特徴量を指し、メルスペクトログラムなどが用いられます。言語特徴量から直接音声波形を生成することは難しいため、音響モデルによって一旦音響特徴量へと変換します。 そして最後に3つめはボコーダーです。ボコーダーは音響モデルによって変換された音響特徴量から音声波形を生成します。 ## 言語処理部における句境界予測について 言語処理部では、言語特徴量として音声的なポーズを挿入します。このようなポーズを句境界と呼びます。句境界は連続する句の間に挿入される音声的なポーズとして定義され、息継ぎやアクセントの変化などによって発生します。一般的にテキスト上で句境界は読点で表され、テキスト音声合成システムが読点を観測した時、音声的なポーズとして句境界が挿入されるとして判定されます。 しかし、このようなルールベースの手法では音声的に正しい位置にポーズを挿入することができないため、機械学習に基づく句境界予測手法が研究されてきました。 また、日本語を対象とした句協会予測の研究手法はいままで提案されてきませんでした。 そこで本プロジェクトでは、より自然な音声を生成するために、句境界の挿入位置を適切に予測するモデルの研究開発を行いました。 研究結果は音声信号処理分野のトップカンファレンスであるINTERSPEECH2021に採択されています。 詳しい手法や実験結果については以下URLをご参照ください。 arxiv: https://arxiv.org/abs/2104.12395 blog: https://engineering.linecorp.com/ja/blog/newgrads-nlp-text-to-speech/ # チーム構成・規模 研究メンバー: 4名 自分の役割 - First authorとして問題設定、実装、実験、論文執筆の実施。

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

マネージメント能力

アピール項目


アウトプット

GitHub アカウント
あり
Qiita アカウント
未入力です
Zenn アカウント
未入力です
Speaker Deck アカウント
未入力です
SlideShare アカウント
あり
特にアピールしたいアウトプット
未入力です

今後、身につけなければいけないと思っている技術は何ですか?

- kubernetes回りのトレンド - フロントエンド(最近あまり触っていないので)

あなたが一番パフォーマンスを出せるのはどんな環境ですか?

未入力です

キャラクター

直近で一番やりたいこと
サービスを作りたい
好きなスタイル
好きな規模
自信を持って人より秀でていると言える点
学習能力 / 分析力 / 問題解決力
スキルのタイプ
得意なフェーズ
会社を選ぶ一番の基準
年収が第一
やりたくない分野
未入力です
その他の特徴
使用言語にはこだわらない / レガシーな環境を改善できる / 新しい技術はとりあえず試す / 3年以内には海外で働きたい / 趣味は仕事 / 多職種のバックグラウンドがある
その他のやりたいこと・やりたくないこと
未入力です

やりたい事

手を動かして設計してコードを書きたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
価値あるプロダクトを作り成長させたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
学び続けて技術力でプロダクトに貢献したい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
意義があることや社会に貢献できる仕事がしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
人や計画の調整・マネジメントをしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
レガシーなシステムの保守・運用・改善をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
企画や仕様を考えるところから関わりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
業務効率を改善して一緒に働く人のためになりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
全社横断的な共通基盤作りや強化をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
組織や文化を作る・成長させる仕事をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい

基本プロフィール

年齢
今年で30代前半
好きな Text Editor
Vim
希望勤務地
東京都 / リモート勤務
集まる必要性がない場合は基本リモートが許可される環境が必要
希望年収
1200万円
転職ドラフトに参加して
企業から指名を受け取ろう!
会員登録をして転職ドラフトに参加すると、参加企業から年収付きの指名を受け取ることができるようになります。
会員登録する
ご意見箱

要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。

なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。

  • {{error}}
SIGN UPSIGN IN


転職ドラフトを友人や同僚に薦める可能性はどのくらいありますか?