Global Information site~siruzou

音声合成といえば「初音ミク」~実は1790年頃にあったしゃべる機械

2014.04.11

音声合成といえば「初音ミク」~実は1790年頃にあったしゃべる機械 はコメントを受け付けていません

街に出るといくつもの人の声が聞こえますが、今やその声の中には自然と「音声合成」が溶け込んでいます。

都会に住んでいれば、もはや1日とて合成された音声を聞かずに過ごすことはできないでしょう。

公共施設やテレビ番組のアナウンスから、一つの楽器として音楽にすら取り入れられています。ごく小さなコミュニティから始まった「初音ミク」は、世界からも注目されており、その売上の3割は海外からと言われています。

音声合成は、近年になって目覚ましい成長をとげたように感じますが、「モノ」に人の声を発声させようとする試みは、意外にも古くから行われてきたのです。

原初の音声合成たち

機械から人の声を出させようとした初めての道具は「トーキングドラム」です。

スポンサーリンク

トーキングドラムとは、アフリカに古くから伝わる楽器です。基本的には太鼓ですが、音に微妙な強弱をつけ、変化させることが可能です。不思議な音色を放つため、インターネットで簡単に購入できるほど人気です。

No18-2-017画像02

今でこそ楽器として使われる機会ばかりですが、もともとは遠方と連絡を取り合うための道具でした。アフリカの言語は、音に高低をつけることで意味を持たせられるものが多いため、トーキングドラムで文字通り「そこそこの会話」が可能だったようです。

学術的な業績としては1790年頃、ドイツ人のヴォルフガング・フォン・ケンペレンが発明した、しゃべる機械「スピーキングマシン」です。

No18-2-017画像03

それまでには「あ~お」の母音を発声させられるような機械はいくつかありましたが、スピーキングマシンは子音も発音できたという点で非常に優れていました。

音楽エフェクターでお馴染み、ヴォコーダー

1900年代に入ると通信技術が発達し、長いケーブルを引くことで遠方との会話が可能になりました。しかし大陸を横断するような規模となると、人の声は複雑すぎたため、送ることができませんでした。

そこで1930年頃、アメリカのベル研究所にて発案されたのが「ヴォコーダー」です。人間の声を数値化すれば、通信する情報が単純になり、遠くへ送りやすくなるのです。

音楽に多少なりとも触れた方ならご存知でしょう。ヴォコーダーといえば、あの「Perfume」の曲にも使われている音楽エフェクターの一種ですが、この技術は音声通信のために考案された技術だったのです。

もっとも、音楽の分野と、通信の分野それぞれで目指していた方向は真逆でした。通信の分野においては、人の声をより自然に伝えるような改良が必要でしたが、音楽では無機質なロボットのような音声が好まれたのです。

スポンサーリンク

障がい者支援として利用されている技術

音声合成の技術が発達し、いよいよ人の声に近づいてくると、その活躍の場は広がっていきます。

合成された音声を利用している方で、もっとも有名なのは、イギリスの物理学者ホーキング博士でしょう。彼は学生の頃、不運にも「筋萎縮性側索硬化症」という筋肉が弱る病気を発症します。この病は、現代でも治療法が確立されていません。

体は長い時間をかけて弱り続け、1985年にはついに話すこともできなくなりました。しかしホーキング博士は現在も物理学者として先頭に立ち、情報を発信しつづけています。その助けになっているのが音声合成です。

No18-2-017画像04

音声合成は、目が見えない人にとっても重要です。文字を読み上げることで、外からの情報を耳から得ることができます。

各種アナウンス

駅のホームなど、公共機関での一部のアナウンスに利用されています。

音声合成の存在を特に有名にしたのが、テレビ番組「モヤモヤさまぁ~ず2」でしょう。この番組のナレーションには、通称「ショウくん」の音声が使われています。

番組を見た方ならばご存知でしょうが、コンピュータにより合成された音声だと言われても疑うほど、とても自然な声です。2007年に開始し、それから変わらずにショウ君の声が使用されています。

ショウ君の親元である「HOYAサービス株式会社」のホームページによると、実はショウ君は「第一世代」であり、より自然な発声が可能なバージョンが存在しています。まだまだ自然な発声が可能というのは、末恐ろしくもあります。

「ニコニコ動画」にて注目、活用された音声合成ソフト

音声合成が意外な活躍をみせたのは、インターネット上、とりわけ動画投稿サイトでの使われ方でしょう。

「初音ミク」は今やコンビニなどでも耳にするほどの知名度となりましたが、これは合成された音声に歌わせるソフトウェアであり、このようなソフトは、技術的に優れていたとはいえ、すでにあるものでした。

しかし、当時はニコニコ動画やyoutubeなど、動画投稿サイトが広く知られるようになっていました。個人で作った曲を発表する機会が誰にでもあったのです。それにより「初音ミク」は瞬く間に大ヒットすることになりました。

動画投稿サイトで発表できるのは、曲だけではありません。ゲームや車載動画、プラモデル組み立てなど、何でも配信の対象となりました。

しかし自分の声に自信がない、滑舌が悪くとも、動画として成立させるために、音声合成ソフトで解説をつける、という方法があるのです。

音声合成ソフトにはフリーで公開されているものがあり、誰でも利用可能です。ある特定の声がつけられた一連の動画が、今では「ゆっくり実況」などと呼ばれ、特にニコニコ動画上では人気のコンテンツとなっています。

No18-2-017画像05

これからの使われ方

iPhoneにも搭載され始めた「siri」は、機械と人間が「音声」でコミュニケーションを図りながら、操作することができます。声を分析した結果、機械が言葉をしゃべり、機械が言葉を聞き取ることまで可能になったのです。

人間がヒトを作る時代が、もうそこまで来ているのかもしれません。

byヒビタカ

スポンサーリンク

Pocket
LINEで送る

関連記事

コメントは利用できません。

知る蔵のTwitter~フォーローをお願います

知る蔵グループ関連専門サイト