夢と見栄。

私が修士のときに所属していた研究室には企業との共同研究を遂行している学生が常に複数人いた。それらの企業の開発者たちが言った言葉が未だに印象に残っている。 私はそのときその企業には関わっていなかったが、なぜか会議に同席していた。当時助手だった…

モンテカルロ5五将棋の試み、その1。

本日の日記はコンピュータ将棋の話題である。といっても、本文にはほとんど内容はない。内容があるのはソースコードのみである。 結構前からコンピュータ将棋を作っている。コンピュータ将棋の今の主流の考え方はmin-max法に基づくものだが、私はコンピュー…

「べ」と「で」と「げ」の違い・その2、およびその前置き。

本日は音声の話である。前半は一般論だが、後半はマニアックな話である。 音声工学の歴史はわりと浅い。長く見積もっても百年であり、短く見積もると五十年くらいである。その五十年の歴史をさかのぼると、最初に手作業で試行錯誤していた時代があり、徐々に…

最善手は五分のわかれ。

今年もくだらないことを書く日がやってきた。今年は囲碁の話を書く。私が今はまっているのは将棋観戦だが、今日は囲碁のことである。 小学校三年か四年くらいの頃に、三ヶ月か半年くらい、囲碁を習っていたことがある。近所で碁会所を開いていたアマチュアの…

フィクションの中の音声工学。

先日、知り合いが「踊る大捜査線」のスピンオフの「交渉人 真下正義」を見たと言っていた。そのときに「最近の警察って音声からぱぱっと犯人を割り出せちゃうんだねえ」とも言っていた。どうやら、あれがフィクション内の誇張表現だとは思っておらず、作中で…

ほぼ見ているだけで将棋の大局観が身につく方法。

将棋の話をしようと思うのですが、私はもっぱら観戦するのみで自分では指さない人です。多分、自分で指そうとすると、かなり悲惨な盤面になるのではないかと思います。そんな私でも、観戦だけは楽しむことができます。いつもプロ棋士たちの対局を楽しんでい…

「べ」と「で」と「げ」の違い・その1。

(※非常にマニアックな話です。) (※また、まだ確証の得られていない話です。) (※「その2」はいつになるか分かりません。) 本日の日記は音声の話題である。特に子音の弁別についての話題であり、その中でも表題のとおり日本語の/b/と/d/と/g/の違いの話…

サイバー大学の長期インターンシップ。

本日の日記も私的な日記であり、関係各所の意志とは無関係である。と前置きをしたところで私がアルバイターとして所属しているサイバー大学(ソフトバンクグループ)の話である。なお、サイバー大学というのはインターネットを利用した通信制の大学である。…

純音とブザー音。

今は将棋ではなく音声についていろいろとやっているのであるが、なかなかうまくいきそうにない。そういうわけで、つなぎ的な軽い日記を書く。なお、専門外の人にとっては多少分かりづらいところがあると思う。 私は子音についていろいろと考えているのだが、…

モンテカルロどうぶつしょうぎの試み4(勝率優先探索)。

本日の日記はコンピュータ将棋の話である。「どうぶつしょうぎ」という4×3のミニチュア将棋で比較的珍しい手法を試している。(今回も文章と動画で説明しようと思っていたのだが、OSをバージョンアップしたら動画のエンコーディングがうまくいかなくなった…

第四回エンターテイメントと認知科学シンポジウムに行ってきた。

本日の日記は一ヶ月以上前のシンポジウムの話である。電気通信大学に「エンターテイメントと認知科学研究ステーション」という組織があり、そこが主催しているシンポジウムのことである。 3月22日と23日に第四回(つまり四年目)が開かれ、私は22日の…

曲がりなりにも「否定表現」を実用している自動将棋解説システム。

本日の日記は、コンピュータ将棋の技術を応用した自動将棋解説についての話である。また、「ない」という否定表現についての話でもある。なお、この話は半年くらい前から書こうと思っていたものなのだが、忙しくて書きそびれていた。 さて、一年くらい前から…

音声認識用の自然言語を作るとしたら。

本日の話はたわごとであるが、それなりに面白いような気がするので書く。音声認識とインタフェースに関する話である。 とある人に音声認識についていろいろと聞かれた。その人はほとんど音声認識について技術的な知識がなく、質問は「今どこまで音声認識はで…

どうぶつcafeに行ってきた。

昨日、東西線門前仲町駅から徒歩三分くらいの深川東京モダン館というところで開かれた「どうぶつしょうぎcafe vol.1『with タコツボ』@深川東京モダン館」というイベントに参加して、どうぶつしょうぎとタコツボを指してきた。本日の日記はこのブログによく…

ほぼ時間周波数伸縮しか使わない自動単語音声認識。

本日の日記は音声認識についての話である。とにかくシンプルに音声認識アルゴリズムを設計したらどういうことになるのかという実験について語る。 目標は自動単語音声認識である。現在の音声認識というのは大抵「文」の音声認識なのであるが、それよりも一段…

サイバー大学に関する雑感。

サイバー大学という大学がある。これはインターネットの大学の総称ではなく、例えば早稲田大学とか東京大学といった名称と同様に、固有名詞である。私は現在そこで授業補助のアルバイトをしており、結構面白い特質を持った大学だと思ったので雑感を書く。 私…

「何かが欠けている音声認識研究」についての話。

12月21日から22日にかけて、東京大学で「第11回音声言語シンポジウム」という学会が開かれ、その初日に東工大の古井貞煕先生が「何かが欠けている音声認識研究」という題名で講演をした。本日の日記はその講演に対する感想である。(ところで本日の…

「ATOK の辞書をつくる」というエントリの紹介。

本日の日記は、本当にリンクを張るだけなのだが、とにかくよいエントリだと思ったので、紹介する。 ATOK の辞書をつくる 一応書籍の紹介という体裁をとっているのだが、地味なデータベース作りがいかに重要かということが書かれている。私は隣接分野の人間な…

多数決合議と楽観合議とモンテカルロ。

コンピュータ将棋の話である。電気通信大学の伊藤研究室が作った手法に関する話である。 現在、合議と呼ばれるアルゴリズムがある。同一局面に対して複数のCPUを同時に走らせてその結果から次の一手を多数決で決めようというアルゴリズムである。これをあと…

音声認識の特徴量に雑音はどれくらい混ざっているのか。

現在の音声認識は背景雑音にものすごく弱い。人間が気にしないような小さなBGMでも音声認識にとっては致命的である。本日の日記も雑音の話である。 先日、自動音声認識というのは、特徴抽出部とデコーダ(音響モデル・言語モデル)からなっているのだという…

音音研と雑音。

2009年11月5日、「音音研」という集まりに行ってきた。音声と音楽のこぢんまりとした研究会である。そのことについては西本先生が詳しく書いている。あまり知られていないことであるが、この研究会の様子はネット中継されていた。ネットの向こう側にいる人に…

自己制限と「あきらめたらそこで試合終了ですよ」。

かれこれ知り合ってから十年くらいになる海燕さんがラジオで「あきらめたらそこで試合終了ですよ」という科白について語るそうである。そのラジオに先駆けて、「あきらめたらそこで試合終了ですよ」という言葉の意味。というエントリを書いている。本来、私…

パワースペクトル列から音韻性が聞きとれるか。

今度は音声の話。結論からいうと、聞きとれる。この話は短く書く。 自動音声認識は、まず、音声を時間周波数解析するところから始まる。このとき、位相情報は捨てられ、パワーの情報のみが残される。このパワーの情報だけで充分な音声認識ができるかどうかが…

モンテカルロどうぶつしょうぎの試み3。

日記をさかのぼると、「モンテカルロどうぶつしょうぎの試み2」は五月の記事のようである。今回の記事も本当は9月にアップロードしようと思っていて、9月には実験が終わっていたのだが、実験が終わった途端にいろいろと忙しくなり、10月になってしまっ…

区切り。

十年単位のきりのよい日なので、これから十年間でやってみたいことを列挙する。全てできるとは思わないが、まあ、羅針盤のようなものである。五年くらい経ったら全く違ったことをしている気もする。 とにかく続けたいのは、子音についての研究である。このブ…

「え」と「い」の実験。

子音の研究をしているのに、この日記に書いているのは母音のことばかりであるような気がする。とにかく、本日の日記は日本語の「え」と「い」についての実験である。結論から書けば、「え」だろうが「い」だろうがある一定以上の高さの狭い帯域だけを取り出…

様々なオリジナリティ観。

現在、コンピュータ将棋選手権のライブラリ制度についていろいろと議論が交わされている。コンピュータ将棋選手権というのは、年に一度開催されるコンピュータ将棋の大会である。そのライブラリ制度というのは、コンピュータ将棋協会が指定したライブラリ(…

id:kohekoと喋ってきた。

先日、「持っている人」は「持たざる人」の気持ちはなかなか理解できないと思う(追記あり)のブックマークで今度喋りましょうと書いたのだが、早速喋ってきた。ルノアールで四時間ほどである。 とりあえず当たり障りのない話をしておくと、kohekoさんは見か…

y=5x。

大学教員の研究と教育のあり方についての話が話題になっている。大学教員は大抵、「研究:1、教育:1、雑用:8」くらいの時間の使い方をしていると思うので、雑用が減れば問題の八割が解決されることだろう。 でも、本日の日記で書きたいのはそういうこと…

子音の調音位置の弁別法が分からないということと、ゼロ交差グラムの正式名称が知りたいということ。

相変わらず、子音について興味がある。本日の日記は、「b,d,g」の違いがスペクトログラムやその亜種を見ても分からなかったのでスペクトログラムを見ても分からないところに違いがあるのではないかという感想と、DFTによるスペクトログラム以外にも時間周波…