学部四年生の八月初頭。

 助手の先生が「そろそろ卒研でも始めるか」と言った。八月初頭のことである。助手の先生はそのときほとんど何も考えていなかったようであるが、「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」と言われた。

 まず、「音源定位」から解説する。音源定位というのは、音がどこから発せられているのかを推測することをいう。私の場合は音源は人間の声(音声)である。大抵は複数のマイクロホンを空間的に配置して、音圧の差や伝達の遅延時間などを利用する。

 この音源定位、話者が単一の場合にはかなり簡単に問題が解けるのであるが、話者が複数になると途端に難しくなる。複数で最も少ない数は2であるが、話者が二人の場合もかなり難しい。先生は「とりあえず」簡単な方を私に挑戦させてみたことになる。

 いろいろと調べてみると、二次元平面で音源定位をしている文献と、三次元空間で音源定位をしている文献があった。先生は「とりあえず」比較的難しい方を選んだことになる。

 ただし、これだけでは私は何をしたらいいのかが分からなかったので、ほかの拘束条件はないのかと訊いてみた。問題をもう少し限定してくれということである。答えは、「マイクの本数は16本以下」とのことだった(収録機材の都合)。それ以外はマイクの配置から何から何まで自由に問題を設定してくれとのことだった。

 そういう経緯を経て、問題を考え始めた。

 研究とは関係のないことだが、「ファジィ工学」のレポート課題が「一次遅れの制御をシミュレーションせよ」というものだったので、それも片づけた。なお、レポート課題はその一文だけだった。