5月22日(水) 午後 オーガナイズドセッション1(音源分離・音声強調の最新動向 ~ICASSP2024の視点を通じて) (13:00~14:40)
(1) 13:00 – 13:25
ICASSP2024における音源分離・音声強調の動向
○升山義紀(都立大)
(2) 13:25 – 13:50
サンプリング周波数に非依存な深層学習を用いた音源分離
○中村友彦(産総研)
(3) 13:50 – 14:15
IVAとDNNの近接平均に基づく優決定ブラインド音源分離
○松本和樹(早大)・山田宏樹・矢田部浩平(東京農工大)
(4) 14:15 – 14:40
音声強調で音声認識性能はなぜ劣化するのか? ~ 音声強調誤差が音声認識性能に与える影響の分析 ~
○落合 翼(NTT)・岩本一真(同志社大)・マーク デルクロア・池下林太郎・佐藤 宏・荒木章子(NTT)・片桐 滋(同志社大)
−−− 休憩 ( 15分 ) −−−
5月22日(水) 午後 オーガナイズドセッション2(音響シーン分類とイベント検出の新展開) (14:55~16:35)
座長: 川口洋平(日立)
(5) 14:55 – 15:20
環境音の模倣音声を利用した環境音合成とデータセット構築
○岡本悠希(立命館大)・井本桂右(同志社大)・高道慎之介(東大/慶大)・永瀬亮太郎・福森隆寛・山下洋一(立命館大)
(6) 15:20 – 15:45
音色関連特徴量を利用した産業機器の異常音検知
大田恭士・小倉稜也・○鵜木祐史(北陸先端大)
(7) 15:45 – 16:10
Audio-change Captioning to Explain Machine-sound Anomalies
Shunsuke Tsubaki(Doshisha Univ./Hitachi)・○Yohei Kawaguchi・Tomoya Nishida(Hitachi)・Keisuke Imoto(Doshisha Univ.)・Yuki Okamoto(Ritsumeikan Univ./Hitachi)・Kota Dohi・Takashi Endo(Hitachi)
(8) 16:10 – 16:35
音響シーンと音響イベントの同時分析における継続学習の検討
○井上かほり・福本有花・古賀直樹・井本桂右(同志社大)
−−− 休憩 ( 15分 ) −−−
5月22日(水) 午後 招待講演 (16:50~17:40)
(9) 16:50 – 17:40
[招待講演]拡散モデルを用いた生成モデルの基礎と音声強調と分離への応用
○シャイブラー ロビン(LINEヤフー)
一般講演:発表 20 分 + 質疑応答 5 分
招待講演:発表 50 分 + 質疑応答 10 分