緊急地震速報で流れる音声、実は人工的に作られたものなんです。

 

今回は、消防庁が運用する全国瞬時警報システム(J-ALERT)や、自治体の防災行政無線を影で支えているベンチャー企業を紹介します。

 

20110328_ai_1

 

音声合成システム開発「エーアイ」は、入力された文章を人間の声に変換する「AITalk(エーアイトーク)」を開発しました。

 

20110328_ai_4

入力した文章を、いろんなキャラクターの声で読み上げることができる!

AITalk Personal

20110328_ai_3

 

個人向けサービスのひとつ「AITalk Personal(エーアイトーク・パーソナル)」は、用意したテキストを読んで収録した1時間弱の音声を送ると、1ヵ月後には自身の声を合成して使うことができるようになります。

 

これにより、手術や病気(咽頭がんなど)で声帯を失ってしまう患者が、自分の声を永遠に残すことができます。また、大切な人の記念日、冠婚葬祭など、生前のご自身の声でメッセージを届けることもできます。

 

 

特長

人間の声に近い自然な音声

従来の音声合成のイメージといえば「ロボット声」でしたが、AITalkは、人間の肉声に近い自然な音声で読み上げることができます。また、読み上げ速度や、ピッチ、エコー、ゲインを自由に調整できるため、音声の印象を簡単に変えることができます。

 

簡単に自分の声を作成できる

あらかじめ用意している定型文を朗読するだけで、誰の声でも音声データにすることができます。これまでの自動音声技術では、新しい文章を音声合成するたびに録音編集作業が発生していましたが、その作業が不要になり様々な用途での利用が可能になりました。

 

用途

音声合成を使ったサービスやソリューションは身近なところで使われています。

  • 教材マニュアル、E-Learningの音声コンテンツ
  • 国際会議(学会など)のプレゼンテーションでの翻訳文の読み上げ
  • 館内放送、ナレーション音声
  • 緊急通報、災害警報、地域へのお知らせ
  • 道路交通情報、カーナビゲーションの音声ガイド
  • 観光スポット(博物館、美術館など)での音声ガイド
  • 電話窓口の自動応答(コールセンター)
  • ウェブページ、メールの読み上げ
  • 電子書籍の読み上げ、オーディオブック化
  • スマートフォン(iPhone等)内のテキストコンテンツの読み上げ

 

仕組み

人の声で合成する技術コーパスベース音声合成方式を採用しています。

 

STEP1: 音声の学習

あらかじめ収録した音声から特徴を学習して、コーパスと呼ばれる音声データベースを作成します。データベースは、母音と子音を分類した音声辞書と、固有のイントネーションなどを含んだ韻律辞書から構成されています。

 

STEP2: 文章の解析

日本語を分析して、読み仮名を振ったり、アクセントを付ける箇所を決めます。

 

STEP3: 韻律の設定

韻律辞書をもとに、単語の強弱、抑揚などを推定して、パラメータを設定します。

 

STEP4: 音素の検出

音素と呼ばれる音声の単位ごとに文章を細分化して、音声辞書のなかの音声を割り当てます。

 

STEP5: 音声の接続

音素を単純につなげると不自然な「ロボット音声」になってしまいます。そこで、音素を加工して自然な音声になるように補正作業を行います。

 

これで、人間の肉声に近いキレイな音声が出来上がります!

 

20110328_ai_2

音声辞書の作成と音声合成の流れ

 

会社概要

社名:株式会社エーアイ
本社:東京都文京区西片1-15-15 春日ビジネスセンタービル9F
設立:2005年4月
事業:音声合成エンジンおよび関連するソリューションの提供

 

自分の声を永久に保存できるってところに惹かれました。しゃべるのが困難になってしまった人でも簡単に、自由に、滑らかに発話できるようになったことで、希望を与えてくれる技術だと思う。