計算機の系譜
中津井 護
音声グループ在籍:1963〜1986.7.16(第2代音声研究室長)
(うち1975.11.20〜1977.9.30は企画部在籍)
現職:当所通信技術部長
「研究は人なり−その苦悩」といふ題を考えていたが、公開向きではないのでクールな標題に変えることにした。しかし、標題とも若干関係するので、その要点だけ簡単に述べることにする。中田、鈴木の両氏が音声グループのリーダーであった時期には一定数のメンバーのもとに着実な研究が行われていた。小生がグループを引継いでからは要員面で過渡的な状態が続き、研究の継続性に悩む時期が続いた。小生が昭和38年にグループに入って以来新人の投入が無かったことも一因と考えられる。ちなみに、その時期の主要なメンバーである高杉、吉谷、田中の各氏は所内の他部門から転入し、一定期間音声グループで活躍した後、他部門に転出している。唯一の例外は新人とは言いがたい大山氏の場合であるが、同氏も現在はATRに出向中である。3年前に現場を離れて、企画課、通信技術部と歩いた間に、関係者の理解もあって、大阪大学より柳田氏を、科学警察研究所より野田氏を迎え、新人2人と他部門からの転入2人の合わせて6人とすることができ、要員面でもようやくグループらしくなった。「通信総合研究所」への名称変更、所内に於ける情報部門に対する認識の高まり、電気通信フロンティアの発足等、取り巻く環境が順風となったことが大きい。間もなく関西に移る新しいグループが、従来の音声研究の枠に捕らわれずに新天地を切り開くことを祈っている。
さて、話を本題に戻そう。当所で音声研究に使用された代々の計算機を通じて研究の流れを概観することにする。
NEAC2203
昭和38年に入所したときには稼働中であった。昭和36年6月に導入されたもので、磁気ドラムを主記憶とし、入力はフォトテープリーダーであった。もっぱら機械語を使用し、終夜運転のため紙テープを天井や壁に巡らしたことを覚えている。研究は分析や識別が中心であり、モーメント法やA−b−S法によるホルマント抽出、母音・数字語・単音節の識別などが代表例である。音声スペクトルなどのデーターは日本電気との共同研究によってNEAC1103で取得されたものを使用していた。この共同研究は昭和36年に開始され、二期四年に亙るもので、契約書も現存している。昭和60年に民間との共同研究制度が発足する24年も前のことである。
NEAC2206
主記憶がコアメモリーとなり、補助記憶として磁気テープを備えたが、入力はやはり紙テープであり、38年9月の導入であった。アセンブラーの使用によりかなり本格的なソフトが組めるようになった。さらに、翌年にはAD・DAを備えた汎用入出力装置が設置され、当所で分析データーの入力や合成音の出力が可能となった。ソフトによる研究も本格化し、調音パラメータを用いる分析、ボーカルトラクトアナログ合成方式、連続音声の認識等が実施された。調音パラメータに関しては実際の声道形状の取得が必要となり、X線を用いた計測が日本大学医学部と共同で行われた。また、この時期には聴覚モデルのハードウエアも製作された。なを、前述の入出力装置は東北大のグループにも活用された。
NEAC2200/500
昭和42年11月に導入されたもので、ハードはIC化され、ディスクベースのオペレーティングシステムを搭載していた。バッヂ処理が中心で,TSSはなく、入力も紙テープからカードに変わった。言語はFORTRANを使用した。この時期、音声研究室が独立し、計算機の運用グループとは分かれた。調音モデルが引き続き検討され、分析合成系の構成、音源特性の研究などが行われた。FFT、z変換によるディジタルフィルタ等、ディジタル信号処理の利用が本格化した時期にあたり、その後の研究の流れに大きく影響した。音源特性の検討は長時間スペクトルの観察や個人性の検討を通じて嗄声の分析へと発展した。その後海洋開発が注目されるようになり、海中音声通信の調査からヘリウム音声の研究が開始された。また、信号処理の利用による雑音抑圧にも興味が持たれるようになった。
PDP−11/45
長年の念願がかなって専用計算機の整備を昭和48年に開始した。輸入品の奨励されない時期であったが、思いきってDECのミニコンに照準を当てた。当初は16kwのコアメモリとカートリッジディスクでスタートしたが、ソフトの開発ツールが格段に良くできており、ハード面でもFFTの演算速度が当時のセンタ計算機の2倍程度であったと憶えている。ただし、AD・DAのソフトサポートがなかったので、アセンブラによるリアルタイムプログラムの作成に苦労したことを思い出す。研究面では、ヘリウム音声の分析、復元方式の開発が本格化するとともに、音声のSN比を改善するSPACが考案されそれに関する各種の検討が行われた。その後、通信のディジタル化の趨勢に照らし、音声符号化やその品質評価の研究も始められ、CADMや主観SN比による評価法の開発などが行われた。また、雑音抑圧関係ではSUNDERが考案された。なを、この時期には、ヘリウム音声復元の一方式であるSPREXや先のSPACのハードが製作された。
VAX−11/750
計算機の性能は加速度的に向上しており、さすがのPDPも10年経てば老兵であった。移動通信のディジタル化に絡めて大蔵予算を獲得し、昭和59年から2年間で整備した。2メガのメモリと500メガのディスクを持ち、仮想記憶のOSで、PDPの上位機種であったためソフトの移植も容易であった。SUNDERは各種の検討を経て取りまとめに入った。符号化関係では、CADMの最適化を終えて、農工大中田教授の御尽力によりDSPを用いたハード化を試みる事が出来た。また、マルチパルス等符号化における駆動音源に関する各種の検討も行われた。さらに、単音節スポッティングによる単語認識や処理単位としての半音節の検討などが行われた。昭和57年に室員2名というミジメな状況の後、大山氏等の加入もあり、VAXを整備した頃は、修士を含む5名もの研修生を迎えて大変賑やかな時期であった。その後間もなく小生は研究現場から離れる運命となった。
その後、昭和63年には補正予算によりMV/7800とワークステーションが導入された。平成元年には音声研究室は関西支所知覚機構研究室に改組され、器も中身も新しくなった。以上計算機を通して概観した音声グループの約30年間は、ごく大ざっぱに言って、音声研究の黎明期に先導的に研究の本流を形成した前期、音声技術を特殊な分野に応用した中期、通信寄りから本流復帰の芽生えの後期に分けられよう。新しいグループは知的処理に果敢に挑戦しようとしている。関西支所に纏わる困難や障害を克服して、広いスペクトルをカバー出来なくとも鋭いピークを立てることを願って、側面からではあるができる限り支援したい。その内研究仲間に入れてもらいたいものだ。
音声研究グループの資料室のホームページに戻る