『ザ・シンプソンズ』のファンなら、遠い1992年にリリースされた第3シーズンのエピソードを覚えているだろう。このエピソードでは、ホーマーの兄が赤ん坊の泣き声の翻訳機を作り、その発明で彼は財産を取り戻すことができた。スクリーンを超えて 21 世紀に入っても、人工知能の進歩により、この種の天才的な技術が現実世界に現実化することが可能になりました。
小さな子どもが泣くと、多くの親はこう考えます。彼はお腹が空いているでしょうか?それは夢でしょうか?お腹が気になるかな?」データ サイエンティストのアナ ラグナ プラダスは、母性の本能に訴えるだけでなく、答えを提供するシステムを設計しました。 「このアイデアは約7年前、私が第一子を妊娠していたときに思いつきました。その瞬間、科学者の好奇心が、新しい母親としての私の状態と結びついたのです」とマドリード在住の36歳の専門家はニューロストリームに語った。
泣いている赤ちゃんの最初の翻訳者は、ChatGPT をパラダイムとして持つ生成人工知能、画像ジェネレーター、および話し言葉をテキストに効率的に変換するシステムが現在台頭するずっと前に登場しました。このたび、彼らの創意工夫が初めて市販品に組み込まれました。多くの親が子供部屋に設置している監視カメラの中で合併が行われるのは驚くべきことではない。
「このシステムの背後には多くの科学が隠されています」と赤ちゃんの泣き声翻訳機の作者は語る
電話の向こうから、ラグーナ・プラダスのかすかな声が聞こえます。 「優しい言い方でごめんなさい。 「小さな子が私の上で寝ています」と、3 人の子供の母親であるこの母親は語ります。最年少はまだ生後 6 か月です。会話が続く中で、彼は少し前にプロジェクトを開始したとき、深層学習技術が音声などの非構造化データに適用され始めたばかりだったとコメントしました。彼のアイデアを念頭に置いて、彼は赤ちゃんの泣き声が聞こえる基地を探しました。 「それらは存在しなかったので、私は息子を録音し、深層学習アルゴリズムをテストし始めました」と彼は思い出します。
それ以来、この分野の進歩は目覚ましいものでした…
絶対に。これらの進歩がなければ、私たちが行っていることは成り立ちません。実際、過去には、それほど高度ではない技術ではあったものの、泣き声を解釈するための同様のアプリケーションを開発する試みが行われました。これらのシステムは満足のいくエクスペリエンスを提供しませんでした。それ以来、大きな変化と改善が行われました。とりわけ、音声、画像、テキストなどの非構造化データを処理するためです。ここで、非常に革命的なことですが、事前にトレーニングされた生成モデルの世界が出現しました。それは間違いなく偉大な革命です。
この種のシステムには集中的なトレーニングが必要です。赤ちゃんが泣いている通訳の場合、どうやって通訳したのでしょうか?では、彼らは、その録音を、まだ言葉でコミュニケーションできない子どもたちの感情とどのように結びつけるのでしょうか?
ここでの大きな違いはビッグデータです。大量のデータが必要です。これらのニューラル ネットワークは依然として経験から学習する人工頭脳です。私たちの場合、何年もの間、世界中の家族とともにサンプルを収集してきました。モデルにデータを提供する際には、非常に徹底的なプロセスが必要になります。それは専門家だけでなく、臨床医や保護者によっても検証されています。さらに、アルゴリズムが認識しているのが特定の感情やニーズに関連した泣きであることを確認するための非常に厳格なルールがあります。したがって、これには大量のデータ、大量の前処理、大規模なアルゴリズムが必要となるため、非常に手間がかかります。
最近、これを裏付ける科学論文を発表しました。基本的に、私たちがやっていることは音響だけではありません。私たちは、脳波とNIRS技術(近赤外分光法)を通じて、音響(泣き声)と赤ちゃんの脳活動を相関させる臨床的知見をいくつか得ました。さらに、表情や体の動きも評価されます。これは、このシステムの背後に多くの科学があることを示しています。
彼らが発売したばかりの赤ちゃんの泣き声翻訳機能を備えたモニターはどのように機能するのでしょうか?
当社は Maxi Cosi See Pro ベビーモニターを発売しましたが、これは依然としてビデオ監視カメラであり、子供たちが寝ている間に部屋に設置される典型的なものです。加えて、彼らが泣くとき、私たちは彼らを見ているだけでなく、彼らが私たちに警告し、私たちを助け、私たちを助け、私たちをサポートしているということです。重要なのは、泣き声を分析し、それを理由に変換することです。生後数か月間で最も生まれつき備わっているものを示します。夢;ガスによる不快感。不快感;姿勢の変化。迎えに来てほしい人、またはいわゆる「イライラ」の人。
この情報はどのようにして保護者に届くのでしょうか?
彼らはアプリを通じて、赤ちゃんに何が起こっているのか、泣いている理由、そしてどのように行動すべきかについてのアラートを受け取ります。さらに、彼が泣く最も一般的な理由を説明する小さなガイドもあります。音の種類も説明されているため、親はさまざまな泣き声がどのようなものかを理解することができます。それが正常であり、心配する必要もないことを示します。これとは別に、このすべての情報が記録され、統計が表示されるため、親は赤ちゃんを注意深く観察することができ、これらすべてが客観的に記録されます。
ご自宅で赤ちゃん泣き翻訳機を使用したことがありますか?
はい、これから発売される製品を直接テストすることができたのでとても良かったです。ですから、何が正しくて何が間違っているかを知ることができたのはとても良かったです。この種のテクノロジーはサポートであり、あなたに力を与え、子供が特定の理由で泣いていると信じさせ、ほとんどゲーミフィケーションの方法、つまりゲームでそれを確認するものだと思います。それで、一方で、彼が泣く瞬間があって、あなたはこれが彼に起こっていると思い、そして彼はあなたにそれを確認します、それはとてもクールです。先ほども言いましたが、これは一種のゲームです。
現在、私の赤ちゃんは中耳炎にかかっていました。泣き声の統計を見て、痛みやイライラのせいでもっと泣いていたことがわかったので、赤ちゃんに何か問題があると思いました。さらに、一般的に泣く量は平均より多かった。今朝小児科医が私に彼の様子を尋ねたとき、私は彼に、以前よりよく泣いているが、ここではそれが客観化されていると言いました。この意味では非常に便利だと感じており、間違いなく私がナンバーワンのユーザーです。
次のステップ
「私たちはアメリカを発見しているわけではない」とラグーナ・プラダスは赤ちゃんの泣き声の通訳者について認めている。彼のコメントは、すすり泣きの神経学的側面に関する既存の概念を指摘しています。この点に関して、彼女は小児科医と親の両方が解釈を行っていると指摘し、彼女と彼女のチームはそれを客観化することを目指しています。
「目的は、生物学的マーカーとして泣くことが可能であることを示すことです。これは、コミュニケーションの観点から赤ちゃんに何が起こっているのか、赤ちゃんのニーズや感情を理解することで、赤ちゃんの健康をサポートするだけでなく、臨床医の助けにもなります。」自閉症などの特定の病状や神経発達障害を早期に診断すること、私たちが望んでいるのは、医師が追加のツールを利用できるようになり、これらの子供たちの生活を完全に変えるために早期に治療や介入を行うことができるようにすることです。そして社会全般。
6歳の少女アイリーンの泣き声が聞こえると、会話は終わります。丁寧なお別れの前に、母親のラグーナ・プラダスさんが、彼女が主導する取り組みの次のステップについて語ります。同氏は、2024年に新たな資金調達ラウンドが開始され、「製品の規模拡大を継続」し、より多くの臨床試験を実施できるようになることを期待している。その野心は小さくありません。「私たちは赤ちゃんの泣き声の分析に関して世界の参考になりたいと思っています」と彼は結論づけています。
参考資料一覧
- https://www.frontiersin.org/articles/10.3389/fnins.2023.1266873/full
- https://simpsons.fandom.com/es/wiki/Brother,_Can_You_Spare_Two_Dimes%3F
- https://www.linkedin.com/in/ana-laguna-pradas-771a9a2a/
