2007-01-01から1年間の記事一覧

構造と音声。

このブログで何度か同じ日のことを話題にしているのであるが、もう一度その日のことを書く。2004年1月下旬のとある日の話である。その日私は音声の研究会に参加し、そして革新的な概念の発表を目の当たりにした。当時修士二年生の修了間近だった私は、…

とあるものの取り方。

先日ブックマークがたくさんついて懲りたので、もう刺激的な大学関連の日記は書かないようにしようと思っていたのだが、この話は聞いたらやはり書きたくなってしまう。友人のそのまた友人の研究室での話である(例によって友人関係は学外にも及ぶので研究室…

「ポップリサーチ」に関するメール。

先日、学問の世界にもプロとアマチュアがいていいのではないか、ということを書いた。音楽にはクラシックからポップスまで様々な親しみやすさのジャンルがあり、絵画にも抽象画からポップアートまで様々なものがある。だとしたら、学問にも重いものから軽い…

「や」という発音について。

知っている人は知っている話ではあるが、私もこの前初めて確かめたので、あらためて書こうと思う。 「や」という発音は「い」から「あ」に滑らかに変化することによって発声される。そう聞くと、どこかに「い」と「あ」の境界がありそうな気もするが、そんな…

ストップ・ザ・ナンバーズ・ゲーム。

こういった話題は必要以上に人を惹きつけてしまうので、書くのは躊躇われるのだけれども、やはり書く。http://home.att.ne.jp/sigma/satoh/diary.htmlの2007年11月18日の記事で知ったのだが、"stop the numbers game"というコラムがとあるジャーナル…

学部四年生の十二月下旬。

シミュレーションではなく、実環境で実験をした。会議室を一つ借り、そこにマイクロホンを固定し、スピーカーから人間の声を出した。スピーカーを用いたのは、しっかりと位置の計測をするためである。この位置の計測が最も大変だった。マイクロホンの位置が…

コンピュータ将棋とgoogleと自動音声認識の機械学習に関して。

本題に入る前に宣伝から入る。電気通信大学の学園祭期間中に「5五将棋大会」なるものが開かれるそうである。詳しくはhttp://minerva.cs.uec.ac.jp/~uec55/を見てください(この宣伝を書くためだけに、このエントリのアップロードの予定を繰り上げた。本当は…

博士号の取り方。

本日、博士論文の公聴会を開いた。そして、博士号取得がほぼ確定した(これから事務的な手続きがあるのでまだ覆る可能性はないとはいえない)。十二月に修了である。規定の三年間では取得できなかったので、決して簡単だったなどと言うことはできないが、予…

イノベーションは多分これからさらに減っていく。

本日の日記も引用から入る。 でも、企業の「研究所」っていうものが、「本質的に新しいこと」をしようとしているケースは、世間が考えるより少ないんじゃないかなあ。 http://semiprivate.cool.ne.jp/blog/archives/000719.html (中略) まあ、それは大学で…

人の進路にアドバイスをしたら怒られた。

昔は「博士後期に進む=死亡フラグ」じゃない時期があったんですか? http://d.hatena.ne.jp/min2-fly/20071027/1193520052 という問いに対して、そろそろ博士号をとりそうな私が僭越ながら見解を述べようと思う。ただ、一般的には大学院がそもそもいかなる…

音声認識を試したい人に。

先日、音声言語情報処理研究会という学会に行ってきた。そのときに、宣伝されていたのがこのサイトである。音声認識を使ってみたいという方はお試しください。http://w3voice.jp/ その研究会についてのことは、そのうち書こうと思う。

子音と音声認識。

久々だと思うのだが、音声認識の話題である。異論はあるかもしれないが、現在の自動音声認識は母音やある種の有声子音を中心に発達してきたように思える。DPマッチングや隠れマルコフモデルやデルタ特徴量などで、時間変化も見られるようにはなっているが…

学部四年生の十月後半から十二月前半。

十月前半までで、「三次元空間・複数話者・解析的計算の音源定位」のシミュレーションができるようになったわけであるが、実のところ研究の本番はここからである。基礎理論ができてからが研究である。 シミュレーションはできたものの、許容誤差の範囲に収ま…

学問の閉鎖性と「ポップリサーチ」。

2007年9月28日のことである。私は、「爆笑問題のニッポンの教養」というテレビ番組の特番を視聴し、「NLP若手の会第二回シンポジウム」という学会に出席した。時間的順序はテレビ番組の方があとなのだが、先にテレビ番組について語る。 「爆笑問題の…

「ボナンザVS勝負脳」を読む。

bonanzaというコンピュータ将棋のソフトが半年前に人間のトッププロ棋士と対局した。このことは、この記事をわざわざ読みに来る人は知っていることと思う。そして、その対局に関する新書が出た。それが「ボナンザVS勝負脳」である。私は将棋が強いわけでもな…

君と君らしくなさについて。

9月28日に「完璧な鳥」について、ポスターセッションで喋ってくる予定である。完璧な鳥がなんなのかということについては、「http://d.hatena.ne.jp/tihara/20060524#p1」と「http://d.hatena.ne.jp/tihara/20070714#p1」を読んでほしい。この話は、単な…

冒険の書が消えた世代

私の親は団塊の世代で、その下には新人類が存在する。また、私よりも下にはゆとり世代がいる。にもかかわらず、私たちの世代に名称が着いていないのは寂しいと思う人は結構いるようである。 朝日新聞は我々に「ロストジェネレーション」という名前をつけた。…

初音ミクが人間的な歌声を出せるのに、なぜ音声合成は機械的な声のままなのか。*1

時流に乗るのはこのブログの流儀に反するが、一応書いておこうと思う。なお、本日の日記で書くことはほとんどが推測である。なぜなら、公式サイトに書かれている "Frequency-domain Singing Articulation Splicing and Shaping" に関する論文が見つからない…

コンピュータ将棋とパターン認識と制御。

コンピュータ将棋に関する学会発表を見たとき、それが認知科学系の研究会であったこともあって、パターン認識に似ているのではないかと考えてしまった。そしてその後、考えをあらためた。コンピュータ将棋とパターン認識はまるで異なるものである。 コンピュ…

学部四年生の十月前半、その2。

本題に入る前に関係のない話をする。2006年人工知能学会全国大会での村上陽一郎先生の講演映像が配信されていたのであるが配信期限が約一ヶ月後(2007年9月30まで)に迫っているそうである。「科学技術」の歴史に関する講演である。面白い講演なので、見てみ…

「カブロボへの招待 -人工知能を用いた株式取引-」。

人工知能学会学会誌2007年7月号掲載の記事である。短く要約すると、株式に関するロボカップのようなものに関する紹介記事である。 この「カブロボ」は、架空の空間で株を売り買いし、いかに儲かるプログラムを作るかということを競うというものだそうで…

ゆえに、私はセオリーよりもインスピレーションを信じている。

夏休みなので、どうでもいいことを書く。単なる与太話である。 サイエンスというのは常に間違えている。なぜなら、簡単に例外が見つかるからである。理論というのは「大多数が当てはまるモデル」の別名であるので、当てはまらない小数が存在する。 では、間…

学部四年生の十月前半、その1。

助手の先生に「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」と言われ、それが終わったらさらに「それを複数話者に対応させて」と言われた。というわけで、やってみた。 複数話者に対応させるときの考え方は大雑把に分けて二つあ…

学部四年生の八月下旬から九月。

助手の先生から「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」との命を受けたので、問題設定と算数をした。その後、算数の結果をプログラムしてみた。それなりに長いスクリプトを書くのは初めてだったので、一ヶ月ほどかかった…

学部四年生の八月中旬、その2。

マイクへの音声の到来時間差の推定にはCSPという方法を用いた。数ある時間差推定法の中からこれを用いたのはただなんとなくという理由だったが、二ヶ月後に重要な意味を持ってくることになった。CSPとその重要な意味については、そのうち書く。 三つの…

パターンらしさ測定とパターン認識。

実はいまだに「完璧な鳥」という話題について考えている。「完璧な鳥」というのはこのブログの最初の頃に書いた話である。そして、人工知能学会の査読に落ちた話でもある。この話で査読を通そうとは思わないが、看過してはいけない話でもある。概要としては…

学部四年生の八月中旬、その1。

「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」と言われたので問題を考えた。 マイクロホンの本数を現実の本数以下に抑えたということは、空間の大きさも現実の部屋よりも小さめなのだろうということで、「三次元空間」を「一般…

学部四年生の八月初頭。

助手の先生が「そろそろ卒研でも始めるか」と言った。八月初頭のことである。助手の先生はそのときほとんど何も考えていなかったようであるが、「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」と言われた。 まず、「音源定位」か…

学部四年生の五月後半から七月。

集中輪講というものがうちの学科にはあった。大学や学科によってまちまちだとは思うが、一編の英語の論文を読まされて、その論文の内容をほかの研究室の先生や学生の前で説明するのである。英語を読む練習であり、発表の練習でもある。 私の研究室の場合は、…

「単貧民あるいは詰め大貧民の提案」

三月の「エンターテイメントと認知科学シンポジウム」*1での講演の一つが面白かったので紹介する。とはいっても、私はこれは聞いておらず、手元に二ページの予稿があるだけである。 要旨としては「詰め大貧民というものがあってもいいのではないか」というも…