PiZeroで音声認識をさせようと思っていて、開発のベースはNODE-Red + WebAPIと考えています*1。また、GPIOもいろいろ操作したいと思っており、まずはピン番号等を確認。gpioコマンドを使うと、ピン名が一覧で表示され、かつ、設定状態も表示されるので設定間違いも減る。。まずは確認
root@raspberrypi:~# gpio readall +-----+-----+---------+------+---+-Pi Zero--+---+------+---------+-----+-----+ | BCM | wPi | Name | Mode | V | Physical | V | Mode | Name | wPi | BCM | +-----+-----+---------+------+---+----++----+---+------+---------+-----+-----+ | | | 3.3v | | | 1 || 2 | | | 5v | | | | 2 | 8 | SDA.1 | IN | 1 | 3 || 4 | | | 5V | | | | 3 | 9 | SCL.1 | IN | 1 | 5 || 6 | | | 0v | | | | 4 | 7 | GPIO. 7 | IN | 1 | 7 || 8 | 1 | ALT0 | TxD | 15 | 14 | | | | 0v | | | 9 || 10 | 1 | ALT0 | RxD | 16 | 15 | | 17 | 0 | GPIO. 0 | IN | 0 | 11 || 12 | 1 | IN | GPIO. 1 | 1 | 18 | | 27 | 2 | GPIO. 2 | IN | 0 | 13 || 14 | | | 0v | | | | 22 | 3 | GPIO. 3 | IN | 0 | 15 || 16 | 1 | IN | GPIO. 4 | 4 | 23 | | | | 3.3v | | | 17 || 18 | 0 | IN | GPIO. 5 | 5 | 24 | | 10 | 12 | MOSI | IN | 0 | 19 || 20 | | | 0v | | | | 9 | 13 | MISO | IN | 0 | 21 || 22 | 0 | IN | GPIO. 6 | 6 | 25 | | 11 | 14 | SCLK | IN | 0 | 23 || 24 | 1 | IN | CE0 | 10 | 8 | | | | 0v | | | 25 || 26 | 1 | IN | CE1 | 11 | 7 | | 0 | 30 | SDA.0 | IN | 1 | 27 || 28 | 1 | IN | SCL.0 | 31 | 1 | | 5 | 21 | GPIO.21 | IN | 1 | 29 || 30 | | | 0v | | | | 6 | 22 | GPIO.22 | IN | 1 | 31 || 32 | 0 | IN | GPIO.26 | 26 | 12 | | 13 | 23 | GPIO.23 | IN | 0 | 33 || 34 | | | 0v | | | | 19 | 24 | GPIO.24 | IN | 0 | 35 || 36 | 0 | IN | GPIO.27 | 27 | 16 | | 26 | 25 | GPIO.25 | IN | 0 | 37 || 38 | 0 | IN | GPIO.28 | 28 | 20 | | | | 0v | | | 39 || 40 | 0 | IN | GPIO.29 | 29 | 21 | +-----+-----+---------+------+---+----++----+---+------+---------+-----+-----+ | BCM | wPi | Name | Mode | V | Physical | V | Mode | Name | wPi | BCM | +-----+-----+---------+------+---+-Pi Zero--+---+------+---------+-----+-----+
[:W150:left]前回のLチカでは端子番号(物理ピン番号)、12と16を使っていた。どの方法でGPIOを叩くかで呼び名がかわるのだけど、改めて整理すると以下
物理ピン番号 | BCM | wPi | 今回の用途 |
---|---|---|---|
12 | 18 | 1 | LED出力 |
16 | 23 | 4 | SW入力 |
BCMで指定するのはshやbashからGPIOを叩く場合の指定方法、wPiで指定するのはWireingPI等のライブラリ経由でGPIOを叩く場合の指定方法と理解、
書き方にもよるけど、Node-REDのラズパイ用Node(rpi GPIO)はwPiライブラリなんぞを経由しているはずなので、wPiの番号で指定するはず(作業を進めてこの判断が間違いと後で気づく)
Node-REDでLチカを行うにあたり、あらかじめ用意されている、rpi GPIOノードを使う。入力用ノード、出力用ノードがあるのでそれを貼り付けて設定を行う。まずNode-REDでやるのは、上記回路図の物理ピン番号12と16を結線するイメージ。
動作確認する上でLEDを光らせるのが分かりやすいので、出力用ノードの設定から行う。左が設定中の画面。最初、Node-REDのrpiGPIOはWireingPi経由だろうと思っていたら間違いで、素で叩いているようであった。よって、指定するのはBCMのGPIO番号を使うと(PIN12 GPIO18)。プルダウンメニューには物理ピン番号も併記してくれているので間違いもない。初期値の指定も可能で、初期値を0にすることでLEDが点灯するのを確認。
同様に入力SW用のNodeを設定する。先ほどの例にならい、PIN16 GPIO23を指定。チャッタリングのフィルタも指定できるようで、25msを設定。
Node-RED版Lチカのノード、あらかじめ用意されているrpi GPIOノードを2つ繋ぐ。設定内容は上記の通り。入力して出力する。。それだけ。押しボタンSWを押下するとLEDが点灯する。押しボタンSWを細かく操作するとちょっと取りこぼしがあるけど(チャッタリング25msでフィルタされたかも)、多分ポーリングで実装されていると思われしょうがない。(割り込み実装だったら驚きますが。。多分ポーリングと推測(ちゃんとソース調べろよ自分という気もするけど、、まぁおいとこ))
今後の取り組み:
押しボタンSWが押下されたらLEDを点滅、「コマンドをどうぞ」と喋らせて、10秒間録音、録音データをWebAPIで音声認識エンジンに投げ込んで、文字化、文字を再度音声合成させて検証。
この流れがうまくいけば、「シャットダウン」と声をかけると自動でRPIが落ちるようにできるはず。また、「ニュース読み上げ」と声をかけるとRSSを取ってきてヘッドラインを読み上げるとか。最終的には無音検知も作って、ボタン押さなくても音声認識シーケンスが走るようにしたい。