ヒッグス粒子が話題です。

 今、ヒッグス粒子が話題です。私も気になったのでヒッグス粒子についていろいろとウェブ上を検索してみたのですが、さっぱり分かりませんでした。重力がどうのこうのとか、クォークとなんとかとフォトンとなんとかとあとそれがないとおかしいとか、そういう日本語は読めるのですが、内容がほぼ理解できません。スピンって何、なんで1/3とかいう数値が出てくるのとか、分からないことだらけです。

 で、思いました。きっと、私の出身研究室でさっぱり音声の研究ができなかった学生たちというのはそういう気分だったんだろうと。きっと、周波数って何、なんで確率が出てくるの、とかそういう気分だったんだろうと。私にとってのヒッグス粒子は、彼らにとっての音声で、しかも彼らは私とは違ってどうにか卒論をやり過ごさないと卒業できないというすごいプレッシャーがかかっていたはずです。もっといえば、中学校の二次方程式でつまづいた人たちも、「は?」という気分だったんだろうと思います。

 ヒッグス粒子に話を戻しますが、いくつかのウェブページをぱらぱらと読んで、ようやく科学に予算をつけたくなくなる気持ちが分かりました。だって、予算をつけても私は楽しめないんですよ。なんか、ヒッグス粒子に携わっている人たちはとても楽しそうですが、私は全く楽しくないんです。それよりはマンガを読んでいたほうが楽しいので、そちらに予算をつけたくなります。

 これまで、なんで学問の予算がここまで削られるんだろうなあと不思議に思ってきましたが、ようやく実感できました。学者以外が楽しくないんじゃ、予算は削られる一方です。

母音のよくある図。

 だからといってどうということもない話。分かる人だけ分かってください。

 世界中の母音を語る上でこの図がよく出てきます。口を開いているとか、前の方で喋っているとか、口が丸いとか、あの図です。

 現在、別の目的のために母音をちょこちょこといじっているのですが、この図の存在とまるでかみあわないんですよ。そのうちかみあうのかもしれませんが、とりあえず今はこの図の存在が私の中で否定されつつあります。

 まあ、音声認識とか音声合成とか工学系の技術はこの図とあまり関係がないので困らないんですが。

文理な話。

 最近はどうでもいい話はgoogle+に書いているのですが、この話をgoogle+に書くのもちょっとなあと思ったので、こっちに書きます。「Google 辞めました - アスペ日記」を読んでの感想です。

 リンク先のエントリは、一言でいってしまえば会社と自分との方針が違ったのでgoogleを辞めたというただそれだけの話なんですが、面白かった。こんな私の文章なんか読んでいないでご一読ください。多分、8割くらいの人には面白いから。

 この人の経歴がプロフィールのところに書かれていたので読んでみたのですが、これがすでに面白いです。京都大学の工学部を一年で辞めて、大阪外大でがっちり言語の勉強をしているんですね。その後、ワープロソフトを作る会社で働いて、それからもう一度語学の勉強をして、京都大学自然言語処理修士課程に入る。で、約一年前にgoogleに入って退社。

 要するに、文系的な意味で言語の好きな、理系のプログラマ

 いやー、そりゃあ苦労しますよ。だって、自然言語処理(理系)と言語学(文系)って今は方向性がまったく違いますもん。私は音声信号処理(理系)屋さんで、自然言語処理のお隣の分野の人間ですが、自然言語処理って言語学の大切なところをがんがん無視していく分野なんですね。言葉のことを知っていれば知っているほど、自然言語処理が乱暴な分野に見えるはずです。この人がつらいのは当然です。

 で、今の世の中に多分この人の居場所はないだろうなあと思うんですよ。どうしてそう思うかというと、私の居場所もないからです。私も、音声の好きな理系の研究者です。ただしこの人とは違って純粋に理系出身です。そんな理系の人が音声学(文系)・音韻論(文系)をかじってしまうと、今の音声信号処理や音声認識がめちゃくちゃなことをしているように見えるんですよ。でも、理系の人は「それなりのものができているんだから問題ない」と言い、文系の人は信号処理や自動認識の仕組みにはそもそも興味がないんですね。だから、今の音声認識はまずいだろ、と指摘する人がものすごく少ないんです。じゃあどうするかというと仕方がないから自分一人の研究所で研究を進めるしかないんですね。この人もきっとそんな感じでしょう。

 じゃあ、どうするかという話なんですが、どうしようもないでしょう。この人もこれからひっそり生きていくんだろうなと思います。週末に自分でいろいろと開発したりして。

合成音の「あぁ?」。

 今日の日記は、分かる人にだけ分かればいい話です。音声合成の話です。短い話です。つまらないです。

 私の研究の目的は音声合成ではないのですが、途中で合成の話が絡んできたのでそのことをちょこっと書きます。今回のミッションとしては、一つのスペクトルから人の声を合成するというものでありふれたものです。

 入力はこのスペクトルです。「あ」のスペクトルです。

 ほかにはなんらデータを使わず、データを使わないので機械学習もすることなく、いわばルールベースのやり方で音声を合成します。分析合成ではなく本当に合成ですね。

 で、これが合成音です。「あぁ?」という感じになっています。へー、こういう音になるんだなー、と思いました。人の声っぽく聞こえますかね。韻律は手動調整です。

 波形としてはこんな感じで、いたって普通の音声波形だと思います。

 というそれだけの日記です。たまには音声のことも書かないと将棋の話ばかりになってしまうので書きました。

 なお、最初の「あ」のスペクトルについてですが、「重点領域研究「音声言語」・試験研究「音声DB」連続音声データベース*1」という長い名前のデータベースの一つの音声のごく一部をお借りしています。

*1:板橋秀一「文部省「重点領域研究」による音声データベース」日本音響学会誌,48巻,12号,pp. 894-898 (1992)

弱いコンピュータ将棋「こまお」について。

 今日の日記は周回遅れの技術で作ったコンピュータ将棋の話です。

 先日、「こまお」移転先はこちら)というコンピュータ将棋を公開しました。こまおの特徴はとにかく弱いことです。攻めは遅く、受けはほとんどできず、筋は悪く、一手詰すら見つけられません。その上、平手から10枚落ち(玉と歩だけ)まであるので、10枚落ちを選べばほとんどの人が勝てるでしょう。アルゴリズム的にも数世代前のものを使っており、しかも、わざわざ駒損する筋を選んだりします。

 なぜ、そんなコンピュータ将棋を作ったのか。それが今日の日記の本題です。昨年末だったと思いますが、プロ棋士の遠山五段がニコニコ動画の生放送で、コンピュータ将棋について「人を育ててくれるようなコンピュータ」について言及していた憶えがあります(ちょっと記憶が曖昧なのですが)。そのときは、将棋の道場は人手不足でルールから教えなければならない人はさすがに教えていられないこともあるということがセットで語られていた気がします(ここ半年くらいでこのあたりはかなり変わってきた気もしますが)。これを聞いて当時の私は、「ルールならハム将棋で憶えることができるじゃないか」と思っていました。それから、そこから少しレベルアップした人には「金沢将棋」がすでにあると思っていました。そして、さらに強い人には「激指」もあります(私自身は金沢将棋も激指もプレイしたことはありませんが評判はよいです)。つまり、すでに人間を育てるソフトは充分に揃っていると思っていました。

 その考えが甘いと分かったのは、とある将棋初心者と盤をはさんで指したときでした。私もそれほど強くはないので、私が4枚(飛角香)落として指しました。その初心者の方は「金沢将棋のレベル1に負ける」と言っていました。序盤は問題なさそうに思えたのでいい勝負かと思った矢先、銀をタダで捨ててきました。狙いは特になさそうでした。そして、角と金を交換してきました。これも狙いはありませんでした。さらに飛車を捨てて銀と交換してきました。不思議な指し手だと思いつつも、指し続けました。終局して家に帰ってから、あの人はハム将棋の10枚落ちにも負けるだろうと思いました。

 将棋というのはやはりそこそこ強くないと面白くないもので、やはりある程度の強さがないと観戦すらできません。ある程度というのは私の感覚だと、ハム将棋の平手にまぐれで(あるいは攻略サイトを見ながら)一回勝つ程度です。で、そこまでたどりつくためには、何局も指す必要があります。そして、何局も指すためには、半分くらいは勝てないと続きません。将棋というのは勝てないと面白くないのです。そういうわけで、ハム将棋に勝てない人のための将棋が必要だと感じました。だから作りました。

 作る前に、指導対局をする側のプロ棋士にどういうことに気をつけているかといったことを聞いたりもしました。具体的に対局中にどういったアドバイスをするのかということです。いろいろと教えていただきましたが、相手の指し手についての感想を言うとのことだったので、私にできる範囲で人間の指し手について言語化しました。主に駒の価値に重点を置いた台詞になっています。指導対局では指導する側の指し手そのものにも意味があるものですが、そこまではとても実装できませんでした。また、指導を受ける側のアマチュアの方にも簡単に話を聞かせていただき参考にしました。

 実際に作ってみて、「勝てた!」という喜びの声も聞こえてきましたが、大きな反省点も二つありました。

 一つは、それでもやはり強すぎるらしいということです。10枚落ちに負ける友人もいました。また、開発過程をセミクローズドな空間で公開していたのですが、10枚落ちのランダム指しに苦戦する友人もいました。落とす枚数に応じて弱くするといった凝った設計にする必要もあったかもしれません。

 もう一つは、Firefoxを主たるテスト環境にしていたので気づかなかったのですが、IEだと重いということです。ウィンドウズのデフォルトブラウザがIEなのでそれを基準にテストするのが当然だったはずですが、思い至りませんでした。その後、軽くしようと努力しましたが(重いコードであるという自覚はあったのでいじれば軽くなるはずだと思っていました)、私の技術ではどうにもならず、結局最初の重いままの状態で公開しています。一つ言い訳を書くとすれば、JavaScriptを触るのは初めてであり、またGUIも初めてであり、そもそもコードを書くのは得意ではなかったのです。JavaScriptを憶えるのに購入したのは「JavaScript&jQueryレッスンブック」という本です。本自体は分かりやすかったですが、プログラミングが苦手なので途中で挫折しました。

 それから、反省点ではありませんが、やはり自然な指し手で弱くするのは難しかったです。弱いというのは要するに最善手から程遠いということですが、単純に悪い手を指そうとすると不自然になるのです。このあたり、学問的にも面白い研究課題だと思います。人間はなぜか自然な悪手を指すことができるのです。

 あと、「こまお」という名前をつけるにあたり知恵を貸してくださった方々ありがとうございました。どうでもいい話ですが、漢字で書くと「駒男」でもあり、「子猫(こ・まお)」でもあります。

 長くなりましたが、とにかくせっかく弱いコンピュータ将棋を作ったのでたくさんの初心者と戦って負けたいと思っています。

学者の試行錯誤ツイートについて。

 本日の日記は、学者の一般的な印象に関する話である。

 先日友人に、学問で食えないと愚痴を言っていた。そうしたらその友人に、「そういえばずっと前の音声の解説面白かったよ」と言われた。音声は私の専門である。それはそれで嬉しいのだけれど、その友人はそれを私の作業への最大限の肯定として言っていたのが残念でもあった。なぜ残念なのかといえば、解説こそが学者の仕事だという印象を抱かれていることがなんとなく分かったからである。付き合いの長い友人で、これからも付き合っていくだろう友人がそういう感じなので、おそらく周りに学者がいない人は、テレビや新聞で解説している学者の印象しかないだろうと思う。

 学者の作業で最も多くの時間を割かねばならないのは、研究に関する試行錯誤であり解説ではない。特に、素人への解説はエンターテインメントの側面が強いので、作業の中心とはならない。また、順序立てて公式のようなものを当てはめていけば結果が出ると勘違いされていることも多いが、むしろ試行錯誤の末に公式を創り出すのが学者の使命である。

 このあたり、なぜ勘違いされるのだろうと思っていたが、それは試行錯誤している姿を周りに見せていないからだと思う。私は現在、自宅で両親とともに住んでいて、そこで研究をしているのだが、最初はやはり研究に関して理解してもらえなかった。そんなある日、パソコンが壊れ、ヘッドフォンジャックをパソコンに挿していても内蔵スピーカーから音が漏れるようになった。結果的に、両親は数ヶ月間ずっと私が作った変な音を聞きつづけることになり、ようやく試行錯誤というものが何であるかということを理解するにいたった。そして研究作業がどのようなものかも分かったようであった。やはり、試行錯誤している姿を見せないと、研究を理解してはもらえないのだ。

 今、twitterで学者を見ていると、「最近の若い者は」というツイートや、教育に関する愚痴や、研究費への文句や、論文の締切りで忙しいという話や、任期の切実な身の上話や、言いようもなく辛いという心情吐露や、研究のhow toなどであふれている印象であり、肝心の「今日も実験に失敗した」「今日も分からなかった」「今日も思いつかなかった」というツイートがほとんどない。研究をしていれば毎日のようになんらかの失敗しているはずであるが、それがない。それでは学者の作業が一般の人に分からないのも仕方がない。

 私は、twitterでは将棋観戦クラスタにいるのでほとんど将棋のことばかりツイートしているが、google+では具体的な内容までは踏み込まないまでも実験失敗報告を結構書いている。意識的に書くようにしている。そういった類のことを多くの学者がツイートし始めたら、学者への印象が変わるんだろうなと思う。

大学の求人に関する記録。

 本日の日記は単なる記録です。おそらく読んでも面白くはありません。

 twitterから流れてきた情報ですが、東洋大学の教員の求人情報の中に注目すべきものがあるとのことでした。この求人サイトは研究者ならほぼ誰もが知っている有名なものです。就職先の機関は東洋大学の総合情報学部で、「情報基礎教育プログラム」担当の助教を求めているとのことでした。授業や研究以外にも様々な業務があり、普通の助教と何ら変わりはありません。

 ただ一ヶ所だけ注目すべき点は、「常勤(任期あり)1年間で再任なし」となっているところでした。教員を1年間しか雇っていられないということです。世の中は派遣切りなどが厳しく、ほかの職業に比べたら1年間も職が保証されているというのは幸せなことかもしれませんが、大学教員としては「常勤」で「1年間」で「再任なし」というのは珍しいことなので話題になりました。確かに、年々雇用条件が厳しくなっていたのですが、とうとうここまで来たかという感じです。

 少子化によりどの大学も経営が厳しくなっているので雇用条件をよくしろと要求するのは無理があると思われますが、とにかく事実として雇用条件はここまで厳しくなりました。今後もさらに厳しくなっていくことでしょう。

 そういうわけで、博士号取得ののち大学教員になりたいと考えている方はどうぞお気をつけください。また、進学先の大学を選んでいる高校生の方々もいろいろとお気をつけください。

 以上、単なる記録でした。