学部四年生の八月中旬、その1。

 「とりあえず三次元空間で単一話者の音源定位のシミュレーションをしてみて」と言われたので問題を考えた。

 マイクロホンの本数を現実の本数以下に抑えたということは、空間の大きさも現実の部屋よりも小さめなのだろうということで、「三次元空間」を「一般的な部屋の大きさ」にしてみようと考えた。どうせシミュレーションなので、部屋の具体的な大きさはどうにでもなる。

 それから、マイクの配置であるが、これはどのように解くかということに関わってくる重要な案件である。であるので、どのように解くかということから先に考えることにした。それまでに読んだ先行研究では、反復演算を用いて計算していた。それは面倒くさそうだと思ったので、解析解が求まる方法を考えることにした。

 平面上ではマイクが二つあれば近似的に音源の方向が求まる。平面の方向ベクトルの自由度が2で、マイク二つから計算できる時間差がその自由度を1奪うので残りの自由度が1になる。ということは、三次元空間上ではマイクが三つあれば音源の方向が求まるはずである。いろいろとこのほかにも空間の周波数分解能などを考えなければならないのであるが、とりあえず三角形にマイクを配置すれば音源の方向が求まる。

 この三角形のマイクのグループが二つあれば、音源付近でマイクから伸びる半直線が交わるはずなので、音源の位置が確定する。マイクのグループは多ければ多いほど精度が上がるはずであるので、三角形のマイクのグループは五つ使うことにした。天井と四方の壁にそれぞれ一つずつである。

 こうして、問題設定と解法が組み上がった。あとは、算数とプログラムを頑張るだけである。