2024年3月プログラム

投稿者: | 2024/01/24

2月29日(木) 午前 SP1(中ホール312) (09:30~10:50)

(1)/SP 09:30 – 09:50
話者照合のための声道長摂動に基づく疑似話者生成によるデータ拡張
○若松智花・塩田さやか・貴家仁志(都立大)

(2)/SP 09:50 – 10:10
話者照合のための話者性の変動量を考慮した声道長摂動による疑似話者生成
○大野史夏・若松智花・塩田さやか(都立大)

(3)/SP 10:10 – 10:30
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換
○五十嵐琢斗・齋藤佑樹・関 健太郎・高道慎之介(東大)・山本龍一・橘 健太郎(LY)・猿渡 洋(東大)

(4)/SP 10:30 – 10:50
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化
○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大)

−−− 休憩 ( 10分 ) −−−

2月29日(木) 午前 EA1(研修室(中)304) (09:30~10:50)

(5)/EA 09:30 – 09:50
非負値行列因子分解を用いた音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の同時推定
○西田光佑・植野夏樹・小野順貴(都立大)・北村大地(香川高専)

(6)/EA 09:50 – 10:10
プロジェクションバックされた分離行列の直接更新
○栗城結衣・中嶋大志・小野順貴(都立大)

(7)/EA 10:10 – 10:30
日常会話の発話重畳分析と非同期分散録音に対するオンライン独立ベクトル分析による分離の検討
○南木春希・中嶋大志・山岡洸瑛・若林佑幸・小野順貴(都立大)

(8)/EA 10:30 – 10:50
空間正則化付き独立低ランク行列分析におけるベクトルワイズ座標降下法の高速化・安定化アルゴリズム
○石川悠人・大久保拓哉・高宗典玄(東大)・中村友彦(産総研)・北村大地(香川高専)・猿渡 洋(東大)・高橋 祐・近藤多伸(ヤマハ)

−−− 休憩 ( 10分 ) −−−

2月29日(木) 午後 SLP(中ホール312) (11:00~12:20)

(9) 11:00 – 11:20
音環境に適応するテキスト音声合成のための一人称視点コーパス構築
○武 伯寒,高道 慎之介,関 健太郎(東大),坂東 宜昭(産総研),猿渡 洋(東大)

(10) 11:20 – 11:40
教師無し学習に基づくコールセンターの非定型対話検出
○瀬川 修(中部電力),林 知樹(HDL)

(11) 11:40 – 12:00
パラレルデータを用いた知識蒸留によるNeural Transducer型目的話者音声認識の性能改善の検討
○森谷 崇史,佐藤 宏,落合 翼,デルクロア マーク,芦原 孝典,松浦 孝平,田中 智大,増村 亮,小川 厚徳,浅見 太一(NTT)

(12) 12:00 – 12:20
DDPMVC: 連続時間拡散確率モデルを用いた非パラレル声質変換と評価
○畠山 瑠一,奥田 耕平,中鹿 亘(電通大)

−−− 休憩 ( 90分 ) −−−

2月29日(木) 午前 EA2(研修室(中)304) (11:00~12:20)

(13)/EA 11:00 – 11:20
カーネル補間による入射音場推定における散乱体形状の影響評価
○小塚詩穂里(NTT)・小山翔一(総研大)・伊藤弘章・鎌土記良(NTT)

(14)/EA 11:20 – 11:40
騒音制御フィルタ選択によるバーチャルセンシングフィードバックANCシステムに関する検討
○豊岡祥太・梶川嘉延(関西大)

(15)/EA 11:40 – 12:00
大規模モノラルダークデータを用いた音響イベント定位・検出の構築
○坂東宜昭(産総研)・廣橋義寛・新原竜馬(デンソー)

(16)/EA 12:00 – 12:20
Filtered-x法型能動騒音制御システムを安定に動作させる条件について
○藤井健作(コダウェイ研)・棟安実治(関西大)・苣木禎史(千葉工大)

−−− 休憩 ( 90分 ) −−−

2月29日(木) 午後 招待講演1(APSIPA JC) (13:50~14:35)

(17)/共通 13:50 – 14:35
[招待講演]Making the Invisible Visible: Toward High-Quality Deep THz Computational Imaging
○Chia-Wen Lin(National Tsing Hua Univ.)

−−− 休憩 ( 10分 ) −−−

2月29日(木) 午後 IEEE SPS 授賞式 (14:45~15:00)

(18) 14:45 – 15:00
授賞式

−−− 休憩 ( 10分 ) −−−

2月29日(木) 午後 ショート・オーラル(APSIPA JCセッション, 中ホール312) (15:10~15:55)

(19)/共通 15:10 – 15:15
Speaker Diarizationにおけるクラスタリングの計算量削減
○山下孔明・下倉良太・飯國洋二(阪大)

(20)/共通 15:15 – 15:20
軟骨伝導を二次音源とした選択的アクティブノイズコントロール ~ Delayed-X Harmonics Synthesizer アルゴリズムを用いた複合音・狭帯域ノイズの消音 ~
○東 美幸・下倉良太・飯國洋二(阪大)

(21)/共通 15:20 – 15:25
Audio Adversarial Examplesによる音声CAPTCHAへの応用
○信川裕介・下倉良太・飯國洋二(阪大)

(22)/共通 15:25 – 15:30
CNNを用いた画質評価指標の妥当性の評価
○原田莉理子(阪大)・早川 諒(東京農工大)・飯國洋二(阪大)

(23)/共通 15:30 – 15:35
クラウドソーシングで収集した方言アクセントラベルに基づく End-to-End 日本語音声合成の方言適応
○織田悠希・山内一輝・齋藤佑樹・猿渡 洋(東大)

(24)/共通 15:35 – 15:40
SRC4VCデータセット:多話者音声変換モデルのベンチマークを目的とした実デバイス収録音声コーパス
○齋藤佑樹・五十嵐琢斗・関 健太郎・高道慎之介(東大)・山本龍一・橘 健太郎(LY)・猿渡 洋(東大)

(25)/共通 15:40 – 15:45
話者照合となりすまし検出のための日本語音声コーパスJ-SpAWの初期検証
○菅野滉大(都立大)・高道慎之介(東大)・塩田さやか(都立大)

(26)/共通 15:45 – 15:50
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について
○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大)

(27)/共通 15:50 – 15:55
実環境におけるクリギングを用いた任意位置での直接音到来時間推定
○山下美月・立蔵洋介(静岡大)

−−− 休憩 ( 10分 ) −−−

2月29日(木) 午後 SP2(中ホール312) (16:05~17:25)

(28)/SP 16:05 – 16:25
クワドロコプタを用いた災害時生存者捜索のための音源定位の検討 ~ PyRoomAcousticsを用いた環境モデリングとMUSIC法に関わる要因の分析 ~
○鎌田賢知(早大)・大和淳司(工学院大)・及川靖広・奥乃 博・大谷 淳(早大)

(29)/SP 16:25 – 16:45
音声を用いた心理的ストレス有無分類モデルの構築
○加藤花歩・高島瑛彦・菊入 圭・吉村 健(NTTドコモ)

(30)/SP 16:45 – 17:05
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定
○越森道貴(電通大)・嵯峨山茂樹(東大/電通大)・中鹿 亘(電通大)

(31)/SP 17:05 – 17:25
A Study on Automatic Performance System for Emulating the Playing Style of a Specific Pianist using Feature Extraction with LSTM and Score Analys
○Li Senhao・Matsuno Yutaka(Nihon Univ.)

2月29日(木) 午後 SIP1(研修室(中)304) (16:20~17:40)

(32)/SIP 16:20 – 16:40
Dynamic sensor placement on graphs based on sampling theory and online dictionary learning
○Saki Nomura(TUAT)・Junya Hara・Yuichi Tanaka・Hiroshi Higashi(Osaka Univ.)

(33)/SIP 16:40 – 17:00
グラフ転移学習と最適輸送に基づく時変ネットワークのための非同期カルマンフィルタ
○福原伝博・原 惇也・東 広志・田中雄一(阪大)

(34)/SIP 17:00 – 17:20
Kernel-Induced Sampling Theorem for A Class of Mapping-Prescribed Reproducing Kernel Hilbert Spaces
○Akira Tanaka(Hokkaido Univ.)

(35)/SIP 17:20 – 17:40
Vision Transformer の連合学習のためのモデル精度の劣化を生じないプライバシー保護強化法
○麻生 伶・塩田さやか・貴家仁志(都立大)

2月29日(木) 午後 ポスターセッション1 SIP/EA(研修室(中)305) (15:10~17:20)

(36)/SIP 15:10 – 16:10
スパース係数の秘匿を考慮した深層展開でのISTAによるLASSO解推定
○由解仁知翔(琉球大)・石原裕之(NTT)・仲地孝之(琉球大)

(37)/SIP 15:10 – 16:10
軽量で解釈可能な深層学習モデルを用いた脳波の睡眠段階分類
○伊藤青空・田中聡久(東京農工大)

(38)/SIP 15:10 – 16:10
非凸スパース最適化を用いた識別性基準の要素選択
○河村泰雅・植野夏樹・小野順貴(都立大)

(39)/SIP 15:10 – 16:10
不可逆な飽和歪みを伴う観測系に基づくパラメータ推定におけるクラメール・ラオの下界の導出
○植野夏樹・亀岡弘和(NTT)

(40)/SIP 15:10 – 16:10
行列補間のための適応的部分空間クラスタリング
○和田拓土(法政大)・佐々木亮平(東京工科大)・小西克巳(法政大)

(41)/SIP 15:10 – 16:10
連合学習における局所勾配の類似度に基づくビザンチン攻撃検出法
○大野賢太・山岸昌夫(法政大)

−−− 休憩 ( 10分 ) −−−

(42)/EA 16:20 – 17:20
分散マイクロホンアレイネットワークに基づく矩形領域内部の複数音源定位システム
○高橋 徹・福田光太郎・上林大輝・大垣 斉(阪産大)・東川諒央(coroutine)・中山雅人(阪産大)

(43)/EA 16:20 – 17:20
IVAとDNNを近接平均化した優決定BSSに用いるDNNのアーキテクチャの比較
○松本和樹(早大)・山田宏樹・矢田部浩平(東京農工大)

(44)/EA 16:20 – 17:20
全方位音源追尾のためのマイクロホン対の役割選択
○佐々木遥人・陶山健仁(東京電機大)

(45)/EA 16:20 – 17:20
音源信号の独立化に基づく残留ノイズ除去
○古澤 魁・陶山健仁(東京電機大)

(46)/EA 16:20 – 17:20
指向性設計の抑圧区間に対する指定誤差の有効性
○日高 司・陶山健仁(東京電機大)

(47)/EA 16:20 – 17:20
高空間解像度マイクロホン対を用いた複数音源定位
○堀 智也・陶山健仁(東京電機大)

3月1日(金) 午前 ポスターセッション2 SP/SLP(中ホール312) (09:30~11:40)

(48)/SP 09:30 – 10:30
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討
○森田湧大・齋藤大輔・峯松信明(東大)

(49)/SP 09:30 – 10:30
下位N位スコア平均に基づくMOS予測モデル学習
○近藤祐斗・亀岡弘和・田中 宏・金子卓弘(NTT)

(50)/SP 09:30 – 10:30
Remixed2Remixedを用いた音声強調のモデル学習法の改善
○李 莉・関 翔悟(サイバーエージェント)

(51)/SP 09:30 – 10:30
仮想歩行アプリケーションにおける静止状態での環境音合成に関する検討
○西島大史・森田湧大・齋藤大輔・峯松信明(東大)

(52)/SP 09:30 – 10:30
テキストのない音声に対する自己教師あり学習モデルによる音声合成の分析 ~ 多言語活用を中心に ~
○朴 浚鎔・齋藤大輔・峯松信明(東大)

(53)/SP 09:30 – 10:30
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成
○山内一輝・齋藤佑樹・猿渡 洋(東大)

(54)/SP 09:30 – 10:30
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価
○前島 亮・北岡教英(豊技大)

(55)/SP 09:30 – 10:30
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応
○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大)

(56)/SP 09:30 – 10:30
複数音声認識モデルを統合した音声認識システムの高精度化
○北條圭悟・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小川厚徳(NTT)・北岡教英(豊橋技科大)

(57)/SP 09:30 – 10:30
話者適応による聴覚障害者音声認識の評価
○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大)

−−− 休憩 ( 10分 ) −−−

(58)/SP 10:40 – 11:40
x-vectorの話者空間を利用した2話者間の中間話者音声合成
○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大)

(59)/SP 10:40 – 11:40
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現
○今市夏菜子・中鹿 亘(電通大)

(60)/SP 10:40 – 11:40
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討
○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT)

(61)/SP 10:40 – 11:40
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換
○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大)

(62)/SP 10:40 – 11:40
異常検知を目的とした音響信号による織機動作解析の検討
○酒向慎司(名工大)

(63)/SP 10:40 – 11:40
Transformerを用いた脳波信号からの音声復元の検討
○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大)

(64)/SP 10:40 – 11:40
音源波形状に着目した地声-裏声変換と音源波パラメータの制御
○岡田翔太・北村 悠・齋藤大輔・峯松信明(東大)

(65) 10:40 – 11:40
[SLP] End-to-End音声認識モデルを用いた専門用語の認識誤り検出と訂正
○大戸 康隆,坂井 信輔,河原 達也

(66) 10:40 – 11:40
[SLP] Low-resource Speech Recognition using Hierarchical CTC and Large Pre-trained Model
○Jaeyoung Lee, Tatsuya Kawahara

−−− 休憩 ( 110分 ) −−−

3月1日(金) 午前 SIP2(研修室(中)304) (09:30~10:50)

(67)/SIP 09:30 – 09:50
数式認識モデルへのブラックボックス攻撃に関する一手法
○名村晴人・吉田正朋(同志社大)・アダミ ニコラ(ブレシア大)・奥田正浩(同志社大)

(68)/SIP 09:50 – 10:10
共通誤差最小化に基づく音響エコー・雑音キャンセラのための可変ステップサイズ
○岩居健太・西浦敬信(立命館大)

(69)/SIP 10:10 – 10:30
メロディ想起時における脳波の時間周波数,事象関連電位,有向接続性解析
○後藤麻友・チャンポーンパックディー インオン・松永華月・伊藤秀真・田中聡久(東京農工大)

(70)/SIP 10:30 – 10:50
混合音声の無相関化に基づくブラインド信号源分離
○齋藤晋哉・大石邦夫(東京工科大)

−−− 休憩 ( 10分 ) −−−

3月1日(金) 午前 EA3(研修室(中)304) (11:00~12:20)

(71)/EA 11:00 – 11:20
ピッチシフトおよびソフトクリッピングによるヴィオラからチェロへの音色変換
○吉野夏樹・田中 章(北大)

(72)/EA 11:20 – 11:40
微分方程式に基づく有限次数調波信号の多重ピッチ推定
○山田健太・升山義紀・山岡洸瑛・植野夏樹・小野順貴(都立大)

(73)/EA 11:40 – 12:00
H∞制御理論を用いた肩掛け型ウェアラブルスピーカの逆フィルタ設計 ~ MIMOシステムへの拡張と評価 ~
○喜田健司(大同大)

(74)/EA 12:00 – 12:20
スパース表現を用いた成分選択によるリモート合唱音源の混合法
○太田晴紀・高橋弘太(電通大)

−−− 休憩 ( 70分 ) −−−

3月1日(金) 午後 招待講演 SLP(大ホール101) (13:30~14:15)

(75) 13:30 – 14:15
音声処理オープンソースツールキットESPnetの現在と未来
林 知樹(HDL)

−−− 休憩 ( 10分 ) −−−

3月1日(金) 午後 招待講演 EA(大ホール101) (14:25~15:10)

(76) 14:25 – 15:10
TBD

−−− 休憩 ( 15分 ) −−−

3月1日(金) 午後 ポスターセッション3 EA/SIP(大ホール101) (15:25~17:25)

(77)/EA 15:25 – 16:25
Clarity Prediction Challenge 2のための音声了解度評価指標の調査
○山本克彦(サイバーエージェント)

(78)/EA 15:25 – 16:25
正中面及び矢状面上の異なる仰角に配置された2音源間の空間的マスキング効果について
○藤城博人・西口正之・渡邉貫治・安倍幸治(秋田県立大)

(79)/EA 15:25 – 16:25
ピアノ音に対する音階と残響のモーフィング
○箱田由馬・土屋隆生(同志社大)

(80)/EA 15:25 – 16:25
マイクロホン数を削減したビームフォーミングが音空間合成に与える要因
○大屋敷凌佑・渡邉貫治・西口正之・安倍幸治(秋田県立大)

(81)/EA 15:25 – 16:25
動的な音源の方位及び帯域が再生音の遅延の検知限に与える影響
○齋藤優季・西口正之・渡邉貫治・安倍幸治(秋田県立大)

(82)/EA 15:25 – 16:25
パンニングによるバイノーラルレンダリングのための学習による代表頭部インパルス応答の生成
○法師人和希・西口正之・渡邉貫治・安倍幸治(秋田県立大)

−−− 休憩 ( 10分 ) −−−

(83)/EA 16:35 – 17:35
音源の放射特性を用いたバイノーラル合成における仮想音源の回転方向の弁別
○西山織絵(千葉工大)・堀内俊治・大久保翔太(KDDI総合研)・苣木禎史(千葉工大)

(84)/EA 16:35 – 17:35
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価
○本山智司・植野夏樹・安田昌弘(都立大)・木下裕磨(東海大)・小野順貴(都立大)

(85)/EA 16:35 – 17:35
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価
○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史,島ノ江修平,種村友貴

(86)/SIP 16:35 – 17:35
大規模事前学習と動的畳み込みを用いた悪天候による劣化の除去
○山下修吾・池原雅章(慶大)

(87)/SIP 16:35 – 17:35
ステレオ脳波からの傾聴メロディの再合成
○稲葉湧大・熊谷優惟子・吉村直己・古明地秀治(東京農工大)・三橋 匠・飯村康司・鈴木皓晴・菅野秀宜(順天堂大)・田中聡久(東京農工大)

(88)/SIP 16:35 – 17:35
無向グラフ信号解析のための高グラフ周波数密度グラフフーリエフレームの設計
二谷海都・○京地清介(工学院大)

3月1日(金) 午後 午後 SP3(研修室(中)304) (15:25~16:25)

(89)/SP 15:25 – 15:45
Generating Japanese-accented English voices of 3 types according to the listening proficiency of Japanese ESL learners
○Kiyotada Mori・Yasuo Miyoshi・Ryo Okamoto(Kochi Univ.)

(90)/SP 15:45 – 16:05
音声エージェントの印象に合致する音声の加工強度の予測
○宮本 蓮・森田湧大・齋藤大輔・峯松信明(東大)

(91)/SP 16:05 – 16:25
テキスト生成の自動評価尺度に基づく音声生成の自動評価
○佐伯高明(東大)・マイティ ソウミ(カーネギーメロン大)・高道慎之介(東大)・渡部晋治(カーネギーメロン大)・猿渡 洋(東大)

一般講演:発表 15 分 + 質疑応答 5 分
招待講演:発表 40 分 + 質疑応答 5 分