文献紹介

フリーソフトの音声認識エンジンを使ってみたい人のための本。

本の紹介をする。フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで作者: 荒木雅弘出版社/メーカー: 森北出版発売日: 2007/10/01メディア: 単行本(ソフトカバー)購入: 45人 クリック: 519回この商品を含むブログ (3…

猫の画像を加工した例と画像処理の初歩の一部、およびそのソースコード。

画像加工の例とその考え方 これまで、「音声認識のしくみ」と「音声合成のしくみ」の簡単な説明ページを作ってきた。第三弾は「画像処理の考え方」である。今回は細かい算数の部分が書きたくて書いた。かけ算と足し算によるフィルタリングがメインである。 …

初音ミクなどの音声合成のしくみ。

初音ミクという歌声合成ソフトが売り出されてから約半年が経つ。その間、様々な初音ミクに対する言説を見てきたが、社会的・心理的・哲学的な観点からの言及ばかりで、科学的な観点からの言及が少なかったので、科学的な観点から簡単な解説を書いた。絵本を…

「認識とパタン」。

絶版のようであるが、図書館にはあったので紹介する。実に三十年前の本であるが、未だに議論に決着のついていないことばかりが書かれている。岩波新書である。本日の日記では、私が面白いと感じた部分を抜き出す。私の文章ではなく、引用した文章を中心に読…

ストップ・ザ・ナンバーズ・ゲーム。

こういった話題は必要以上に人を惹きつけてしまうので、書くのは躊躇われるのだけれども、やはり書く。http://home.att.ne.jp/sigma/satoh/diary.htmlの2007年11月18日の記事で知ったのだが、"stop the numbers game"というコラムがとあるジャーナル…

「カブロボへの招待 -人工知能を用いた株式取引-」。

人工知能学会学会誌2007年7月号掲載の記事である。短く要約すると、株式に関するロボカップのようなものに関する紹介記事である。 この「カブロボ」は、架空の空間で株を売り買いし、いかに儲かるプログラムを作るかということを競うというものだそうで…

「単貧民あるいは詰め大貧民の提案」

三月の「エンターテイメントと認知科学シンポジウム」*1での講演の一つが面白かったので紹介する。とはいっても、私はこれは聞いておらず、手元に二ページの予稿があるだけである。 要旨としては「詰め大貧民というものがあってもいいのではないか」というも…

「音声の構造的表象に基づく英語学習者発音の音響的分析」

かなり長い間、掲載を待っていた論文である。非常に面白い論文であるが、電子情報通信学会論文誌Dのアカウントを持っていないと読めない。ただし、理工系の大学の図書館に行けば論文誌が見つかることと思う。また、個人でアカウントを持っていなくても、大…

「本当に6人でつながるの? -SNSの世界から探るSix Degrees of Separation-」

一言でいえば、GREEのネットワークで「六度の隔たり」が成り立つかどうかということを報告している。電子情報通信学会学会誌2007年2月号に掲載されている。大きな図書館ならば普通の図書館にもあるはずである。記事執筆者はGREEのスタッフである。 さす…

"発話障害者支援のための音声生成器"

先日、東京大学で開催された音声・聴覚研究会を聴講しに行ってきた*1。ここ数年で音声周りの研究会のレベルが上がっているように思えるのだが、そのことは置いておいて、最も印象に残った発表を紹介する。タグは「音声認識」となっているが、音声合成の研究…

専門外の人から見るBonanza。

先日、将棋の渡辺竜王とコンピュータ将棋Bonanzaの対局がおこなわれ、Bonanzaが負けた。ニュースではBonanzaの惜敗であるということになっているが、いろいろとネットを見て回ったところでは「惜敗ではなく大差だ」との主張もあるようである。私は将棋につい…

"ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習"

言語獲得について研究している人の予稿である。どうしたら機械が自動的に言語を憶えていってくれるかという壮大なテーマに挑戦し続けている人の書いたものである。著作権がどうなっているのかは知らないが、こちらにアップロードされている。http://www.slc.…

"On the importance of phase in human speech recognition"

面白い論文があったので紹介する。題名を日本語に訳すと、「人間の音声認識における位相の重要性について」あたりになる。こちらにアブストラクトが載っている(http://ieeexplore.ieee.org/xpls/abs_all.jsp?isnumber=35293&arnumber=1678004&count=35&inde…

"Noise Reduction in Time Domain Using Referential Reconstruction"

文献紹介となっているが、他人のものではなく自分の論文である。電子情報通信学会は基本的に転載禁止なのであるが、要旨だけは公開されているので要旨程度のことなら語っていいものと思われる。なお要旨はこちらにある(http://search.ieice.org/bin/summary…

「2006年度 人工知能学会全国大会 映像配信」

以下のページにて、「科学と技術は違うんですよ」という内容から始まる村上陽一郎先生のご講演の映像を見ることができる。また、AIの有名な日本の先生方へのインタビューも聞ける。面白いと思うので、是非ご覧いただきたい。 http://www.ai-gakkai.or.jp/jsa…

「文書群に対する物語構造の動的分解・再構成フレームワーク」*1

現在この記事を書きながら、検索のトップにこのページが来てしまうことを恐れているが、やはり面白いものは紹介しなければもったいないと思うので紹介する。なお、原典はhttp://www.jstage.jst.go.jp/article/tjsai/21/5/21_428/_article/-char/ja/のPDF…