2021/11/27 更新

写真a

ハラ スナオ
原 直
HARA Sunao
所属
ヘルスシステム統合科学学域 助教
職名
助教
連絡先
メールアドレス
プロフィール
2003年名古屋大学工学部電気電子情報工学科卒業.
2005年名古屋大学大学院情報科学研究科博士前期課程修了.
2011年同大学大学院情報科学研究科博士後期課程修了.
同年から2012年奈良先端科学技術大学院大学情報科学研究科助教.
2012年岡山大学自然科学研究科助教,現在に至る.
音声認識システムの実用化に関する研究に従事.
2004年日本音響学会ポスター賞,2016年DICOMO2016優秀論文賞,2018年FIT奨励賞受賞.
IEEE,日本音響学会,電子情報通信学会,情報処理学会,ヒューマンインタフェース学会各会員.
外部リンク

学位

  • 博士(情報科学) ( 名古屋大学大学院 情報科学研究科 )

研究キーワード

  • ヒューマンインタフェース

  • 音声対話

  • 音声認識

  • ライフログ

  • 音響シーン分析

  • 音響イベント検出

  • 深層学習

  • 機械学習

  • 音声情報処理

  • 音声対話システム

研究分野

  • 情報通信 / 知能情報学

  • 情報通信 / ウェブ情報学、サービス情報学

  • 情報通信 / 知覚情報処理

経歴

  • 岡山大学   大学院ヘルスシステム統合科学研究科   助教

    2019年4月 - 現在

      詳細を見る

    国名:日本国

    researchmap

  • 岡山大学   大学院自然科学研究科   助教

    2012年9月 - 2019年3月

      詳細を見る

    国名:日本国

    researchmap

  • 奈良先端科学技術大学院大学   助教

    2011年11月 - 2012年9月

      詳細を見る

所属学協会

委員歴

  • 日本音響学会   2022年春季研究発表会 遠隔開催実行委員会 委員  

    2021年10月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2021年秋季研究発表会 遠隔開催実行委員会 委員  

    2021年7月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会 関西支部   若手研究者交流研究発表会 実行委員長  

    2021年4月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2021年春季研究発表会 遠隔開催実行委員会 委員  

    2020年11月 - 2021年3月   

      詳細を見る

  • 日本音響学会   2020年秋季研究発表会 遠隔開催実行委員会 委員  

    2020年7月 - 2020年9月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 電子情報通信学会   ソサイエティ論文誌編集委員会 査読委員  

    2017年8月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 情報処理学会 中国支部   支部運営委員会 委員  

    2015年5月 - 2019年5月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   編集委員会 査読委員  

    2014年2月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   電子化・広報推進委員会  

    2013年10月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会 関西支部   若手研究者交流研究発表会 実行委員  

    2011年11月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   学生・若手フォーラム幹事会  

    2007年3月 - 2012年3月   

      詳細を見る

    団体区分:学協会

    researchmap

▼全件表示

 

論文

  • Acoustic Scene Classifier Based on Gaussian Mixture Model in the Concept Drift Situation 査読

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    Advances in Science, Technology and Engineering Systems Journal   6 ( 5 )   167 - 176   2021年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:ASTES Journal  

    DOI: 10.25046/aj060519

    researchmap

  • Phonetic and Prosodic Information Estimation from Texts for Genuine Japanese End-to-End Text-to-Speech 査読 国際誌

    Naoto Kakegawa, Sunao Hara, Masanobu Abe, Yusuke Ijima

    Interspeech 2021   126 - 130   2021年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    The biggest obstacle to develop end-to-end Japanese text-to-speech (TTS) systems is to estimate phonetic and prosodic information (PPI) from Japanese texts. The following are the reasons: (1) the Kanji characters of the Japanese writing system have multiple corresponding pronunciations, (2) there is no separation mark between words, and (3) an accent nucleus must be assigned at appropriate positions. In this paper, we propose to solve the problems by neural machine translation (NMT) on the basis of encoder-decoder models, and compare NMT models of recurrent neural networks and the Transformer architecture. The proposed model handles texts on token (character) basis, although conventional systems handle them on word basis. To ensure the potential of the proposed approach, NMT models are trained using pairs of sentences and their PPIs that are generated by a conventional Japanese TTS system from 5 million sentences. Evaluation experiments were performed using PPIs that are manually annotated for 5,142 sentences. The experimental results showed that the Transformer architecture has the best performance, with 98.0% accuracy for phonetic information estimation and 95.0% accuracy for PPI estimation. Judging from the results, NMT models are promising toward end-to-end Japanese TTS.

    DOI: 10.21437/interspeech.2021-914

    researchmap

  • Model architectures to extrapolate emotional expressions in DNN-based text-to-speech 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    Speech Communication   126   35 - 43   2021年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Elsevier BV  

    This paper proposes architectures that facilitate the extrapolation of emotional expressions in deep neural network (DNN)-based text-to-speech (TTS). In this study, the meaning of “extrapolate emotional expressions” is to borrow emotional expressions from others, and the collection of emotional speech uttered by target speakers is unnecessary. Although a DNN has potential power to construct DNN-based TTS with emotional expressions and some DNN-based TTS systems have demonstrated satisfactory performances in the expression of the diversity of human speech, it is necessary and troublesome to collect emotional speech uttered by target speakers. To solve this issue, we propose architectures to separately train the speaker feature and the emotional feature and to synthesize speech with any combined quality of speakers and emotions. The architectures are parallel model (PM), serial model (SM), auxiliary input model (AIM), and hybrid models (PM&AIM and SM&AIM). These models are trained through emotional speech uttered by few speakers and neutral speech uttered by many speakers. Objective evaluations demonstrate that the performances in the open-emotion test provide insufficient information. They make a comparison with those in the closed-emotion test, but each speaker has their own manner of expressing emotion. However, subjective evaluation results indicate that the proposed models could convey emotional information to some extent. Notably, the PM can correctly convey sad and joyful emotions at a rate of 60%.

    DOI: 10.1016/j.specom.2020.11.004

    researchmap

    その他リンク: https://arxiv.org/abs/2102.10345

  • Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference (APSIPA-ASC 2020)   826 - 830   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE/APSIPA  

    End-to-end text-to-speech (TTS) models have achieved remarkable results in recent times. However, the model requires a large amount of text and audio data for training. A speaker adaptation method based on fine-tuning has been proposed for constructing a TTS model using small scale data. Although these methods can replicate the target speaker s voice quality, synthesized speech includes the deletion and/or repetition of speech. The goal of speaker adaptation is to change the voice quality to match the target speaker ' s on the premise that adjusting the necessary modules will reduce the amount of data to be fine-tuned. In this paper, we clarify the role of each module in the Transformer-TTS process by not updating it. Specifically, we froze character embedding, encoder, layer predicting stop token, and loss function for estimating sentence ending. The experimental results showed the following: (1) fine-tuning the character embedding did not result in an improvement in the deletion and/or repetition of speech, (2) speech deletion increases if the encoder is not fine-tuned, (3) speech deletion was suppressed when the layer predicting stop token is not fine-tuned, and (4) there are frequent speech repetitions at sentence end when the loss function estimating sentence ending is omitted.

    researchmap

  • Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 査読

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    Proceedings of IEEE REGION 10 CONFERENCE (TENCON 2020)   450 - 455   2020年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/tencon50793.2020.9293766

    researchmap

  • Controlling the Strength of Emotions in Speech-Like Emotional Sound Generated by WaveNet 査読 国際誌

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Proceedings of Interspeech 2020   3421 - 3425   2020年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/interspeech.2020-2064

    researchmap

  • Semi-Supervised Speaker Adaptation for End-to-End Speech Synthesis with Pretrained Models 査読 国際共著 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

    Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2020)   7634 - 7638   2020年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/icassp40776.2020.9053371

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 査読 国際誌

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2019   138 - 142   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/APSIPAASC47483.2019.9023168

    researchmap

  • Speech-like Emotional Sound Generator by WaveNet 査読 国際誌

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2019   143 - 147   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/APSIPAASC47483.2019.9023346

    researchmap

  • A signal processing perspective on human gait: Decoupling walking oscillations and gestures 査読 国際誌

    Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

    Proceedings of the 4th International Conference on Interactive Collaborative Robotics 2019 (ICR 2019)   75 - 85   2019年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-030-26118-4_8

    researchmap

  • Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient's Speech Using Spectral Differential Modification in Voice Conversion. 査読 国際誌

    Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2018, 19th Annual Conference of the International Speech Communication Association, Hyderabad, India, 2-6 September 2018.   2464 - 2468   2018年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/Interspeech.2018-1239

    researchmap

  • Sound sensing using smartphones as a crowdsourcing approach. 査読 国際誌

    Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

    2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017   1328 - 1333   2017年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/APSIPA.2017.8282238

    researchmap

  • An investigation to transplant emotional expressions in DNN-based TTS synthesis. 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017   1253 - 1258   2017年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/APSIPA.2017.8282231

    researchmap

  • New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease. 査読 国際誌

    Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

    Proceedings of the 1st ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks, LocalRec@SIGSPATIAL 2017, Redondo Beach, CA, USA, November 7-10, 2017   1:1 - 1:7   2017年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3148150.3148151

    researchmap

    その他リンク: http://doi.acm.org/10.1145/3148150.3148151

  • Prediction of subjective assessments for a noise map using deep neural networks. 査読 国際誌

    Shota Kobayashi, Masanobu Abe, Sunao Hara

    Adjunct Proceedings of the 2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2017 ACM International Symposium on Wearable Computers, UbiComp/ISWC 2017, Maui, HI, USA, September 11-15, 2017   113 - 116   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3123024.3123091

    researchmap

    その他リンク: http://doi.acm.org/10.1145/3123024.3123091

  • Speaker Dependent Approach for Enhancing a Glossectomy Patient’s Speech via GMM-Based Voice Conversion 査読 国際誌

    Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2017   3384 - 3388   2017年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/interspeech.2017-841

    Web of Science

    researchmap

  • Enhancing a glossectomy patient's speech via GMM-based voice conversion 査読 国際誌

    Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

    2016 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA)   1 - 4   2016年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/apsipa.2016.7820909

    Web of Science

    researchmap

  • LiBS: Lifelog browsing system to support sharing of memories 査読 国際誌

    Atsuya Namba, Sunao Hara, Masanobu Abe

    UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing   165 - 168   2016年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    We propose a lifelog browsing system through which users can share memories of their experiences with other users. Most importantly, by using global positioning system data and time stamps, the system simultaneously displays a variety of log information in a time-synchronous manner. This function empowers users with not only an easy interpretation of other users' experiences but also nonverbal notifications. Shared information on this system includes photographs taken by users, Google street views, shops and restaurants on the map, daily weather, and other items relevant to users' interests. In evaluation experiments, users preferred the proposed system to conventional photograph albums and maps for explaining and sharing their experiences. Moreover, through displayed information, the listeners found out their interest items that had not been mentioned by the speakers.

    DOI: 10.1145/2968219.2971401

    Scopus

    researchmap

    その他リンク: http://doi.acm.org/10.1145/2968219.2971401

  • Safety vs. Privacy: User preferences from the monitored and monitoring sides of a monitoring system 査読 国際誌

    Shigeki Kamada, Sunao Hara, Masanobu Abe

    UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing   101 - 104   2016年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    In this study, in order to develop a monitoring system that takes into account privacy issues, we investigated user preferences in terms of the monitoring and privacy protec-tion levels. The people on the monitoring side wanted the monitoring system to allow them to monitor in detail. Con-versely, it was observed for the people being monitored that the more detailed the monitoring, the greater the feelings of being surveilled intrusively. Evaluation experiments were performed using the location data of three people in differ-ent living areas. The results of the experiments show that it is possible to control the levels of monitoring and privacy protection without being affected by the shape of a living area by adjusting the quantization level of location informa-tion. Furthermore, it became clear that the granularity of location information satisfying the people on the monitored side and the monitoring side is different.

    DOI: 10.1145/2968219.2971412

    Scopus

    researchmap

    その他リンク: http://doi.acm.org/10.1145/2968219.2971412

  • Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation 査読 国際誌

    Sunao Hara, Shota Kobayashi, Masanobu Abe

    IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016)   1 - 6   2016年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents a sound collection system that uses crowdsourcing to gather information for visualizing area characteristics. First, we developed a sound collection system to simultaneously collect physical sounds, their statistics, and subjective evaluations. We then conducted a sound collection experiment using the developed system on 14 participants. We collected 693,582 samples of equivalent Aweighted loudness levels and their locations, and 5,935 samples of sounds and their locations. The data also include subjective evaluations by the participants. In addition, we analyzed the changes in sound properties of some areas before and after the opening of a large-scale shopping mall in a city. Next, we implemented visualizations on the server system to attract users' interests. Finally, we published the system, which can receive sounds from any Android smartphone user. The sound data were continuously collected and achieved a specified result.

    DOI: 10.1109/ICMEW.2016.7574694

    Web of Science

    researchmap

  • A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding 査読 国際誌

    Masaki Yamaoka, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2015   229 - 232   2015年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    We propose a spoken dialog strategy for car navigation systems to facilitate safe driving. To drive safely, drivers need to concentrate on their driving; however, their concentration may be disrupted due to disagreement with their spoken dialog system. Therefore, we need to solve the problems of user misunderstandings as well as misunderstanding of spoken dialog systems. For this purpose, we introduced a driver workload level in spoken dialog management in order to prevent user misunderstandings. A key strategy of the dialog management is to make speech redundant if the driver's workload is too high in assuming that the user probably misunderstand the system utterance under such a condition. An experiment was conducted to compare performances of the proposed method and a conventional method using a user simulator. The simulator is developed under the assumption of two types of drivers: an experienced driver model and a novice driver model. Experimental results showed that the proposed strategies achieved better performance than the conventional one for task completion time, task completion rate, and user's positive speech rate. In particular, these performance differences are greater for novice users than for experienced users.

    DOI: 10.1109/APSIPA.2015.7415511

    Web of Science

    researchmap

  • Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization 査読 国際誌

    Masanobu Abe, Akihiko Hirayama, Sunao Hara

    Proceedings of IEEE International Conference on Consumer Electronics (IEEE-ICCE 2015)   36 - 39   2015年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents an algorithm to mine basic patterns of human activities on a daily basis using non-negative matrix factorization (NMF). The greatest benefit of the algorithm is that it can elicit patterns from which meanings can be easily interpreted. To confirm its performance, the proposed algorithm was applied to PC logging data collected from three occupations in offices. Daily patterns of software usage were extracted for each occupation. Results show that each occupation uses specific software in its own time period, and uses several types of software in parallel in its own combinations. Experiment results also show that patterns of 144 dimension vectors were compressible to those of 11 dimension vectors without degradation in occupation classification performance. Therefore, the proposed algorithm compressed basic software usage patterns to about one-tenth of their original dimensions while preserving the original information. Moreover, the extracted basic patterns showed reasonable interpretation of daily working patterns in offices.

    DOI: 10.1109/ICCE.2015.7066309

    Web of Science

    researchmap

  • Sub-Band Text-to-Speech Combining Sample-Based Spectrum with Statistically Generated Spectrum 査読 国際誌

    Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki, Hideyuki Mizuno

    Proceedings of Interspeech 2015   264 - 268   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    As described in this paper, we propose a sub-band speech synthesis approach to develop a high quality Text-to-Speech (TTS) system: a sample-based spectrum is used in the high-frequency band and spectrum generated by HMM-based TTS is used in the low-frequency band. Herein, sample-based spectrum means spectrum selected from a phoneme database such that it is the most similar to spectrum generated by HMM-based speech synthesis. A key idea is to compensate over-smoothing caused by statistical procedures by introducing a sample-based spectrum, especially in the high-frequency band. Listening test results show that the proposed method has better performance than HMM-based speech synthesis in terms of clarity. It is at the same level as HMM-based speech synthesis in terms of smoothness. In addition, preference test results among the proposed method, HMM-based speech synthesis, and waveform speech synthesis using 80 min speech data reveal that the proposed method is the most liked.

    Web of Science

    researchmap

    その他リンク: http://dblp.uni-trier.de/db/conf/interspeech/interspeech2015.html#conf/interspeech/InaiHAIMM15

  • Sound collection and visualization system enabled participatory and opportunistic sensing approaches 査読 国際誌

    Sunao Hara, Masanobu Abe, Noboru Sonehara

    Proceedings of 2015 IEEE International Conference on Pervasive Computing and Communication Workshops (PerCom Workshops)   390 - 395   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents a sound collection system to visualize environmental sounds that are collected using a crowd sourcing approach. An analysis of physical features is generally used to analyze sound properties; however, human beings not only analyze but also emotionally connect to sounds. If we want to visualize the sounds according to the characteristics of the listener, we need to collect not only the raw sound, but also the subjective feelings associated with them. For this purpose, we developed a sound collection system using a crowdsourcing approach to collect physical sounds, their statistics, and subjective evaluations simultaneously. We then conducted a sound collection experiment using the developed system on ten participants. We collected 6,257 samples of equivalent loudness levels and their locations, and 516 samples of sounds and their locations. Subjective evaluations by the participants are also included in the data. Next, we tried to visualize the sound on a map. The loudness levels are visualized as a color map and the sounds are visualized as icons which indicate the sound type. Finally, we conducted a discrimination experiment on the sound to implement a function of automatic conversion from sounds to appropriate icons. The classifier is trained on the basis of the GMM-UBM (Gaussian Mixture Model and Universal Background Model) method. Experimental results show that the F-measure is 0.52 and the AUC is 0.79.

    DOI: 10.1109/PERCOMW.2015.7134069

    Web of Science

    researchmap

    その他リンク: https://ousar.lib.okayama-u.ac.jp/ja/53271

  • Algorithm to Estimate a Living Area Based on Connectivity of Places with Home 査読 国際誌

    Yuji Matsuo, Sunao Hara, Masanobu Abe

    HCI International 2015 - Posters’ Extended Abstracts (Part II), CCIS 529   529   570 - 576   2015年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:SPRINGER-VERLAG BERLIN  

    We propose an algorithm to estimate a person's living area using his/her collected Global Positioning System (GPS) data. The most important feature of the algorithm is the connectivity of places with a home, i.e., a living area must consist of a home, important places, and routes that connect them. This definition is logical because people usually go to a place from home, and there can be several routes to that place. Experimental results show that the proposed algorithm can estimate living area with a precision of 0.82 and recall of 0.86 compared with the grand truth established by users. It is also confirmed that the connectivity of places with a home is necessary to estimate a reasonable living area.

    DOI: 10.1007/978-3-319-21383-5_95

    Web of Science

    researchmap

  • Extraction of Key Segments from Day-Long Sound Data 査読 国際誌

    Akinori Kasai, Sunao Hara, Masanobu Abe

    HCI International 2015 - Posters’ Extended Abstracts (Part I), CCIS 528   528   620 - 626   2015年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:SPRINGER-VERLAG BERLIN  

    We propose a method to extract particular sound segments from the sound recorded during the course of a day in order to provide sound segments that can be used to facilitate memory. To extract important parts of the sound data, the proposed method utilizes human behavior based on a multisensing approach. To evaluate the performance of the proposed method, we conducted experiments using sound, acceleration, and global positioning system data collected by five participants for approximately two weeks. The experimental results are summarized as follows: (1) various sounds can be extracted by dividing a day into scenes using the acceleration data; (2) sound recorded in unusual places is preferable to sound recorded in usual places; and (3) speech is preferable to nonspeech sound.

    DOI: 10.1007/978-3-319-21380-4_105

    Web of Science

    researchmap

  • A graph-based spoken dialog strategy utilizing multiple understanding hypotheses 査読

    Norihide Kitaoka, Yuji Kinoshita, Sunao Hara, Chiyomi Miyajima, Kazuya Takeda

    Information and Media Technologies   9 ( 1 )   111 - 120   2014年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    We regarded a dialog strategy for information retrieval as a graph search problem and proposed several novel dialog strategies that can recover from misrecognition through a spoken dialog that traverses the graph. To recover from misrecognition without seeking confirmation, our system kept multiple understanding hypotheses at each turn and searched for a globally optimal hypothesis in the graph whose nodes express understanding states across user utterances in a whole dialog. In the search, we used a new criterion based on efficiency in information retrieval and consistency with understanding hypotheses, which is also used to select an appropriate system response. We showed that our system can make more efficient and natural dialogs than previous ones.

    DOI: 10.11185/imt.9.111

    researchmap

  • New approach to emotional information exchange: Experience metaphor based on life logs 査読 国際誌

    Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

    2014 IEEE International Conference on Pervasive Computing and Communication Workshops, PerCom 2014 Workshops   191 - 194   2014年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    We are striving to develop a new communication technology based on individual experiences that can be extracted from life logs. We have proposed the "Emotion Communication Model" and confirmed that significant correlation exists between experience and emotion. As the second step, particularly addressing impressive places and events, this paper describes an investigation of the extent to which we can share emotional information with others through individuals' experiences. Subjective experiments were conducted using life log data collected during 7-47 months. Experiment results show that (1) impressive places are determined by the distance from home, visit frequency, and direction from home and that (2) positive emotional information is highly consistent among people (71.4%), but it is not true for negative emotional information. Therefore, experiences are useful as metaphors to express positive emotional information.

    DOI: 10.1109/PerComW.2014.6815198

    researchmap

  • A Hybrid Text-to-Speech Based on Sub-Band Approach 査読 国際誌

    Takuma Inoue, Sunao Hara, Masanobu Abe

    Proceedings of Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference   1 - 4   2014年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper proposes a sub-band speech synthesis approach to develop high-quality Text-to-Speech (TTS). For the low-frequency band and high-frequency band, Hidden Markov Model (HMM)-based speech synthesis and waveform -based speech synthesis are used, respectively. Both speech synthesis methods are widely known to show good performance and to have benefits and shortcomings from different points of view. One motivation is to apply the right speech synthesis method in the right frequency band. Experiment results show that in terms of the smoothness the proposed approach shows better performance than waveform -based speech synthesis, and in terms of the clarity it shows better than HMM-based speech synthesis. Consequently, the proposed approach combines the inherent benefits from both waveform-based speech synthesis and HMM-based speech synthesis.

    DOI: 10.1109/APSIPA.2014.7041575

    Web of Science

    researchmap

  • Development of a Toolkit Handling Multiple Speech-Oriented Guidance Agents for Mobile Applications 査読 国際誌

    Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

    Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice   79 - 85   2014年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:Springer  

    DOI: 10.1007/978-1-4614-8280-2_8

    researchmap

  • Evaluation of Invalid Input Discrimination Using Bag-of-Words for Speech-Oriented Guidance System 査読 国際誌

    Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

    Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice   389 - 397   2014年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:Springer  

    DOI: 10.1007/978-1-4614-8280-2_35

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却 査読

    真嶋温佳, 藤田洋子, トーレス・ラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    情報処理学会論文誌   54 ( 2 )   443 - 451   2013年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    researchmap

  • 音声対話システムの発話・動作タグN-gramを用いた課題未達成のオンライン検出 査読

    原直, 北岡教英, 武田一哉

    電子情報通信学会論文誌 (D)   J96-D ( 1 )   81 - 93   2013年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    researchmap

    その他リンク: http://search.ieice.org/bin/summary.php?id=j96-d_1_81&category=D&year=2013&lang=J&abst=

  • Acoustic Model Training Using Pseudo-Speaker Features Generated by MLLR Transformations for Robust Speaker-Independent Speech Recognition 査読

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    IEICE TRANSACTIONS on Information and Systems   E95D ( 10 )   2479 - 2485   2012年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG  

    A novel speech feature generation-based acoustic model training method for robust speaker-independent speech recognition is proposed. For decades, speaker adaptation methods have been widely used. All of these adaptation methods need adaptation data. However, our proposed method aims to create speaker-independent acoustic models that cover not only known but also unknown speakers. We achieve this by adopting inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then we train our models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the transformation matrices for the existing speakers are estimated. Next, we construct pseudo-speaker transformations by sampling the weight parameters from the distribution, and apply the transformation to the normalized features of the existing speaker to generate the features of the pseudo-speakers. Finally, using these features, we train the acoustic models. Evaluation results show that the acoustic models trained using our proposed method are robust for unknown speakers.

    DOI: 10.1587/transinf.E95.D.2479

    Web of Science

    researchmap

    その他リンク: http://search.ieice.org/bin/summary.php?id=e95-d_10_2479

  • Causal analysis of task completion errors in spoken music retrieval interactions 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of the 8th international conference on Language Resources and Evaluation (LREC 2012)   1365 - 1372   2012年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, we analyze the causes of task completion errors in spoken dialog systems, using a decision tree with N-gram features of the dialog to detect task-incomplete dialogs. The dialog for a music retrieval task is described by a sequence of tags related to user and system utterances and behaviors. The dialogs are manually classified into two classes: completed and uncompleted music retrieval tasks. Differences in tag classification performance between the two classes are discussed. We then construct decision trees which can detect if a dialog finished with the task completed or not, using information gain criterion. Decision trees using N-grams of manual tags and automatic tags achieved 74.2% and 80.4% classification accuracy, respectively, while the tree using interaction parameters achieved an accuracy rate of 65.7%. We also discuss more details of the causality of task incompletion for spoken dialog systems using such trees.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1059.html

  • Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation 査読 国際誌

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of 2011 Automatic Speech Recognition and Understanding Workshop (ASRU 2011)   169 - 172   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    In this paper, we propose a novel acoustic model training method which is suitable for speaker adaptation in speech recognition. Our method is based on feature generation from a small amount of speakers' data. For decades, speaker adaptation methods have been widely used. Such adaptation methods need some amount of adaptation data and if the data is not sufficient, speech recognition performance degrade significantly. If the seed models to be adapted to a specific speaker can widely cover more speakers, speaker adaptation can perform robustly. To make such robust seed models, we adopt inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then train our seed models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the MLLR transformation matrices for the existing speakers is estimated. Next we generate pseudo-speaker MLLR transformations by sampling the weight parameters from the distribution, and apply the inverse of the transformation to the normalized existing speaker features to generate the pseudo-speakers' features. Finally, using these features, we train the acoustic seed models. Using this seed models, we obtained better speaker adaptation results than using simply environmentally adapted models. © 2011 IEEE.

    DOI: 10.1109/ASRU.2011.6163925

    Scopus

    researchmap

  • Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations 査読 国際誌

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of 2011 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2011)   1 - 5   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:APSIPA  

    researchmap

  • On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of the Paralinguistic Information and Its Integration in Spoken Dialogue Systems Workshop   215 - 225   2011年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of INTERSPEECH 2011   1312 - 1315   2011年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA-INT SPEECH COMMUNICATION ASSOC  

    We propose a method of detecting "task incomplete" dialogs in spoken dialog systems using N-gram-based dialog models. We used a database created during a field test in which inexperienced users used a client-server music retrieval system with a spoken dialog interface on their own PCs. In this study, the dialog for a music retrieval task consisted of a sequence of user and system tags that related their utterances and behaviors. The dialogs were manually classified into two classes: the dialog either completed the music retrieval task or it didn't. We then detected dialogs that did not complete the task, using N-gram probability models or a Support Vector Machine with N-gram feature vectors trained using manually classified dialogs. Off-line and on-line detection experiments were conducted on a large amount of real data, and the results show that our proposed method achieved good classification performance.

    Web of Science

    researchmap

    その他リンク: http://www.isca-speech.org/archive/interspeech_2011/i11_1305.html

  • Music Recommendation System Based on Human-to-human Conversation Recognition 査読 国際誌

    Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Workshop Proceedings of the 7th International Conference on Intelligent Environments: Ambient Intelligence and Smart Environments   10   352 - 361   2011年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:IOS PRESS  

    We developed an ambient system that plays music suitable for the mood of a human-human conversation using words obtained from a continuous-speech recognition system. Using the correspondence between a document space based on the texts related to the music and an acoustic space that expresses various audio features, the continuous-speech recognition results are mapped to an acoustic space. We performed a subjective evaluation of the system. The subjects rated the recommended music and the result reveals that the 10 most highly recommended selections included suitable music.

    DOI: 10.3233/978-1-60750-795-6-352

    Web of Science

    researchmap

  • Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of INTERSPEECH2010   3034 - 3037   2010年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    In this paper, we propose a method of detecting task-incompleted users for a spoken dialog system using an N-gram-based dialog history model. We collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database was made by a field test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model was trained from sequences that consist of user dialog acts and/or system dialog acts for two dialog classes, that is, the dialog completed the music retrieval task or the dialog incompleted the task. Then the system detects unknown dialogs that is not completed the task based on the N-gram likelihood. Experiments were conducted on large real data, and the results show that our proposed method achieved good classification performance. When the classifier correctly detected all of the task-incompleted dialogs, our proposed method achieved a false detection rate of 6%.

    Web of Science

    researchmap

    その他リンク: http://www.isca-speech.org/archive/interspeech_2010/i10_3034.html

  • Rapid acoustic model adaptation using inverse MLLR-based feature generation 査読 国際誌

    Arata Ito, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of ICA2010   1 - 6   2010年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    LREC 2010 - SEVENTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION   78 - 83   2010年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, we propose an estimation method of user satisfaction for a spoken dialog system using an N-gram-based dialog history model. We have collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database is made by a field-test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model is trained from the sequences that consist of users' dialog acts and/or the system's dialog acts for each one of six user satisfaction levels: from 1 to 5 and phi (task not completed). Then, the satisfaction level is estimated based on the N-gram likelihood. Experiments were conducted on the large real data and the results show that our proposed method achieved good classification performance; the classification accuracy was 94.7% in the experiment on a classification into dialogs with task completion and those without task completion. Even if the classifier detected all of the task incomplete dialog correctly, our proposed method achieved the false detection rate of only 6%.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2010/summaries/579.html

  • Data collection and usability study of a PC-based speech application in various user environments 査読 国際誌

    Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Norihide Kitaoka, Kazuya Takeda

    Proceedings of Oriental-COCOSDA 2008   39 - 44   2008年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • In-car Speech Data Collection along with Various Multimodal Signals 査読 国際誌

    Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

    Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08)   1846 - 1851   2008年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, a large-scale real-world speech database is introduced along with other multimedia driving data. We designed a data collection vehicle equipped with various sensors to synchronously record twelve-channel speech, three-channel video, driving behavior including gas and brake pedal pressures, steering angles, and vehicle velocities, physiological signals including driver heart rate, skin conductance, and emotion-based sweating on the palms and soles, etc. These multimodal data are collected while driving on city streets and expressways under four different driving task conditions including two kinds of monologues, human-human dialog, and human-machine dialog. We investigated the response timing of drivers against navigator utterances and found that most overlapped with the preceding utterance due to the task characteristics and the features of Japanese. When comparing utterance length, speaking rate, and the filler rate of driver utterances in human-human and human-machine dialogs, we found that drivers tended to use longer and faster utterances with more fillers to talk with humans than machines.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2008/summaries/472.html

  • 多様な音響環境下における音声認識システム利用時のデータ収集システム 査読

    原直, 宮島千代美, 伊藤克亘, 武田一哉

    電子情報通信学会論文誌(D)   J90-D ( 10 )   2807 - 2816   2007年10月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    researchmap

  • An online customizable music retrieval system with a spoken dialogue interface 査読 国際誌

    Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

    The Journal of the Acoustical Society of America   120 ( 5-2 )   3378 - 3379   2006年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System 査読 国際誌

    Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Proceedings of Oriental-COCOSDA 2005   164 - 168   2005年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

▼全件表示

MISC

  • クラウドセンシングによる環境音の収集 招待

    阿部匡伸, 原直

    騒音制御   42 ( 1 )   20 - 23   2018年

     詳細を見る

    記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    researchmap

  • スマートデバイスによる音収録とその応用 招待

    原直

    日本音響学会誌   73 ( 8 )   483 - 490   2017年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    DOI: 10.20697/jasj.73.8_483

    researchmap

  • イベントを比喩に用いた感情伝達法の検討 査読

    濱野和人, 原直, 阿部匡伸

    電子情報通信学会論文誌   J97-D ( .12 )   1680 - 1683   2014年12月

     詳細を見る

    記述言語:日本語   掲載種別:速報,短報,研究ノート等(学術雑誌)   出版者・発行元:電子情報通信学会  

    researchmap

  • ライフログ研究から見た音響信号の活用 招待

    原直, 阿部 匡伸

    騒音制御   38 ( 1 )   15 - 21   2014年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    researchmap

  • 「音声対話システムの実用化に向けて」10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術 招待

    西村竜一, 原直, 川波弘道, LEE Akinobu, 鹿野清宏

    人工知能学会誌   28 ( 1 )   52 - 59   2013年1月

     詳細を見る

    記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    J-GLOBAL

    researchmap

  • 音声対話システムの発話系列N-gramを利用した課題未達成対話の検出 査読

    原 直, 北岡 教英, 武田 一哉

    電子情報通信学会論文誌. D, 情報・システム   J94-D ( 2 )   497 - 500   2011年2月

     詳細を見る

    記述言語:日本語   掲載種別:速報,短報,研究ノート等(学術雑誌)   出版者・発行元:電子情報通信学会情報・システムソサイエティ  

    CiNii Article

    researchmap

  • A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model 査読

    Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

    The Journal of the Acoustical Society of America   140 ( 4 )   3110 - 3110   2016年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(国際会議)  

    DOI: 10.1121/1.4969721

    researchmap

  • クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

    原直, 笠井昭範, 阿部匡伸, 曽根原登

    電子情報通信学会技術研究報告   113 ( 479 )   29 - 34   2014年3月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語  

    researchmap

  • 音声情報案内システムにおけるBag‐of‐Wordsを用いた無効入力棄却モデルの可搬性の評価

    真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会研究発表会講演論文集(CD-ROM)   2013   ROMBUNNO.3-9-5   2013年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

    真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会研究発表会講演論文集(CD-ROM)   2012   ROMBUNNO.3-1-8   2012年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

    真嶋 温佳, 藤田 洋子, トーレス ラファエル, 川波 弘道, 原 直, 松井 知子, 猿渡 洋, 鹿野 清宏

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 7 )   1 - 6   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    実環境音声情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する.これらの入力はシステムの誤作動・誤認識の原因となるので,無効入力として棄却して応答処理を行わないことが重要である.一般に,有効入力と無効入力との識別にはGMM (Gaussian Mixture Model) による方法など,音響的な情報に基づく方法が用いられることが多い.しかし,入力データに含まれる言語的な情報を使うことにより,システムのタスクも考慮した,より高精度な有効入力と無効入力の識別が可能になると考えられる.そこで本論文では,音声認識結果から得られるBag-of-Words (BOW) を特徴量として,サポートベクターマシン(SVM)および最大エントロピー法を用いた無効入力の識別を検討した.実環境音声情報案内システム「たけまるくん」の入力データを用いた実験では,GMMを用いたSVMによる無効入力の識別と較べ,F尺度を81.73%から83.61%に改善することができた.また,BOW,GMMによる音響尤度,発話時間,SNRを組み合わせた場合,F尺度を86.57%まで改善することができた.

    CiNii Article

    researchmap

  • クラウド時代の新しい音声研究パラダイム

    秋葉 友良, 岩野 公司, 緒方 淳, 小川 哲司, 小野 順貴, 篠崎 隆宏, 篠田 浩一, 南條 浩輝, 西崎 博光, 西田 昌史, 西村 竜一, 原 直, 堀 貴明

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 4 )   1 - 7   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    個人が複数の携帯情報端末を所有し,そこで得られたあらゆる音声データをクラウドに蓄積することが容易になりつつある.このように音声情報処理の周辺環境・技術が激変していく中で,音声情報処理技術のより一層の高度化が求められている.その期待に応えるためには,クラウド処理を前提とした音声研究プラットフォームの構築と,それを基盤とした新しい音声研究のパラダイムが必要である.本稿では,現在までに培われてきた音声情報処理技術を概観した上で,新しい研究パラダイムの方向性とそこで生じる新たな課題について議論する.

    CiNii Article

    researchmap

  • 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

    原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 1 )   1 - 6   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本論文では携帯端末用の音声情報案内システム開発に向けたネットワークサービスソフトウェアの開発について検討する.このソフトウェアは2002年11月よりコミュニティセンターに設置されたたけまるくんシステムを基礎としている.本システムは,音声認識,対話管理,テキスト音声合成を統合したシステムである.WWWサイト開発者にも使いやすいような,Software-as-a-Service (SaaS) を目指すとともに,熟練した開発者や研究者にも使いやすいパッケージとしての展開を検討する.

    CiNii Article

    researchmap

  • D-9-36 多様な利用環境における音声情報案内サービスソフトウェアの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)

    原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏

    電子情報通信学会総合大会講演論文集   2012 ( 1 )   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    researchmap

  • ブラインド音源分離の信頼度を用いたマルチバンド音声認識 (音声)

    安藤 厚志, 大橋 宏正, 原 直, 北岡 教英, 武田 一哉

    電子情報通信学会技術研究報告 : 信学技報   111 ( 431 )   219 - 224   2012年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ブラインド音源分離は音声認識の精度の向上に応用されるが,従来の音源分離法は音声認識の単なる前処理としてしか利用されなかった.本稿では,周波数領域独立成分分析によるブラインド音源分離法と組み合わせたマルチバンド音声認識手法を提案する.音源分離時において,各周波数ごとの分離行列の正確さを推定し,その周波数の信頼度とする.次段の処理では,音源分離の信頼度とメル尺度フィルタバンクエネルギーに基づきマルチバンド音声認識手法により音響尤度を計算する.提案法では音源分離行列の推定誤りとICA後のdepermutation誤りを原因とする認識誤りを削減することが可能となる.提案法を用いて雑音下での孤立単語認識実験を行った結果,単語正解率が平均8.2%,単語正解精度が平均5.7%向上することを確認した.

    CiNii Article

    researchmap

  • MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル (音声)

    伊藤 新, 原 直, 北岡 教英

    電子情報通信学会技術研究報告   110 ( 357 )   55 - 60   2010年12月

     詳細を見る

    出版者・発行元:電子情報通信学会  

    CiNii Article

    researchmap

  • 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)

    大橋 宏正, 北岡 教英, 原 直, 武田 一哉

    電子情報通信学会技術研究報告. SP, 音声   110 ( 220 )   59 - 64   2010年10月

     詳細を見る

    出版者・発行元:社団法人電子情報通信学会  

    音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.

    CiNii Article

    researchmap

  • 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

    原 直, 北岡 教英, 武田 一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2009 ( 14 )   1 - 6   2009年12月

     詳細を見る

    出版者・発行元:一般社団法人情報処理学会  

    本論文では,音声対話システムの対話履歴を N-gram によってモデル化を行い、その尤度に基づいてユーザ満足度の推定を行う手法を提案する.実験では音声対話による楽曲検索システムを利用した実環境音声データに収録されているユーザとシステムの対話履歴を利用して各ユーザの満足度を N-gram の尤度を用いて推定する.それぞれの満足度レベル毎の N-gram モデルは,ユーザの対話行動とシステムの対話行動を符号化した系列を利用することで作成される.本論文では,作成したモデルを用いて満足度の推定を行いその分類性能を評価した.実験結果より,提案手法は高い分類性能を示しており,特にタスク達成者とタスク未達成者の分類では全てのタスク未達成者を検出する際の誤検出率を 10% に抑えることができた.

    CiNii Article

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル

    原 直, 北岡 教英, 武田 一哉

    電子情報通信学会技術研究報告. SP, 音声   108 ( 338 )   61 - 66   2008年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフィールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

    CiNii Article

    researchmap

  • 多様な利用環境における楽曲検索音声対話システムのフィールドテストと評価

    原直, 宮島千代美, 伊藤克亘, 北岡教英, 武田一哉

    情報処理学会第70回全国大会講演論文集   70 ( 5 (3L-4) )   5-341 - 5-342   2008年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    CiNii Article

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)

    原直, 北岡教英, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2008 ( 123 )   61 - 66   2008年

     詳細を見る

    出版者・発行元:社団法人情報処理学会  

    楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフイールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

    CiNii Article

    researchmap

  • 多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)

    原 直, 宮島 千代美, 伊藤 克亘, 武田 一哉

    電子情報通信学会論文誌. D, 情報・システム   90 ( 10 )   2807 - 2816   2007年10月

     詳細を見る

    出版者・発行元:社団法人電子情報通信学会  

    多様なPC利用環境において音声認識の被験者実験を行うために,WWWを利用した音声対話システム及びそのデータ収集システムを構築した.本システムのユーザはPC上にインストールされたクライアントプログラムを用いることで音声対話によりPC内に蓄積された音楽を再生したり,音楽ダウンロードサイトの楽曲を試聴することができる.クライアントプログラムの利用により収集された音声データや対話ログはインターネットを介してサーバ上に蓄積される.サーバには,ユーザごとの辞書のカスタマイズ等の機能も実装している.本システムをインターネット上で試験的に公開し,2か月間のフィールドテストとしてデータ収集を行ったところ合計59時間のシステム稼動時データを収集した.そのうち約5時間41分のデータ(11351個)が音声区間として検出されており,システムに対して発話されていた音声データとして6335発話を得た.

    CiNii Article

    researchmap

  • 楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討(音響・音韻モデル)

    原直, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2007 ( 75 )   87 - 90   2007年7月

     詳細を見る

    出版者・発行元:社団法人情報処理学会  

    本論文では楽曲検索システムの音声インタフェースに適用するための与えられた認識語彙集合に最適なHMM 音響モデルを学習するための手法について述べる。本論文が対象とする楽曲検索アプリケーションにおいては各ユーザ毎にHMM 音響モデルをカスタマイズすることが重要である、なぜなら、1)楽曲名やアーティスト名には一般的なテキスト読み上げコーパスには出現しないような音韻コンテキストが存在すること、2)ユーザによって蓄積している音楽が異なっていること、が理由としてあげられる。特に、認識語彙集合に対して最適な状態共有構造を探すということは音響モデルの学習における新しい問題である。そこで本研究では100名以上の話者による合成音声を用いてタスクに関連した語彙発話を生成しタスク依存音響モデルを構築する手法を提案する。フィールドテストによる評価実験の結果、提案手法により作成したタスク依存音響モデルはタスク非依存音響モデルに比べて約10%の単語誤り削減率を達成することを確認した。

    CiNii Article

    researchmap

  • 楽曲検索音声対話システムの評価 (感性)

    原 直, 伊藤 克亘, 北岡 教英

    シンポジウムモバイル研究論文集   2007   47 - 50   2007年

     詳細を見る

    出版者・発行元:モバイル学会  

    CiNii Article

    researchmap

  • 汎用PC上で利用された音声対話システムによる音声収集と評価(第8回音声言語シンポジウム)

    原直, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2006 ( 136 )   167 - 172   2006年

     詳細を見る

    出版者・発行元:社団法人情報処理学会  

    実際の利用環境に近づけた被験者実験を行うために, WWW経由でカスタマイズ可能な音声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される.本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.

    CiNii Article

    researchmap

  • 長期間の音声対話インタフェース利用時における学習効果の評価

    原 直, 白勢 彩子, 宮島 千代美, 伊藤 克亘, 武田 一哉

    日本音響学会研究発表会講演論文集   2005 ( 1 )   153 - 154   2005年3月

  • 音声対話インタフェースの長期利用時における学習効果の評価

    原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2005 ( 12 )   17 - 22   2005年

     詳細を見る

    出版者・発行元:社団法人情報処理学会  

    本研究では車内での利用を想定した音声対話による楽曲検索システムを構築している.このシステムは, ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.以前の報告ではユーザが約1時間の間システムを利用する実験を行った.この実験において被験者によって度合は異なるものの, 習熟することにより認識性能が向上するという知見が得られた.そこで, 本報告では, 被験者がシステムに十分慣れるように, 1時間のセッションを5回繰り返す実験を行った.実験により収録した12名の音声を分析した結果, 最終日において初日の約60%の誤り改善率を得た.

    CiNii Article

    researchmap

  • 音声対話による楽曲検索システム(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)

    原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2004 ( 103 )   31 - 36   2004年2月

     詳細を見る

    出版者・発行元:社団法人情報処理学会  

    近年,音声認識技術を用いた様々なアプリケーションが考えられている.例えば,ハンズフリーで利用できるという特徴を生かして,カーナビゲーションシステムなどに利用されている.また,インターネット経由の楽曲ダウンロードシステムが増えており,使いやすい楽曲検索インタフェースへの期待が高まっている.そこで本研究では車内での利用を想定した音声対話による楽曲検索システムを作成した.このシステムは,ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.本報告ではシステムの詳細及びシステムを用いた音声対話の収録について述べる.プロトタイプを用いて約150名の被験者実験を行った結果,室内で約80%,実車運転時で約76%の単語正解率を得た.

    CiNii Article

    researchmap

  • ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討

    白勢彩子, 原直, 藤村浩司, 伊藤克亘, 武田一哉, 板倉文忠

    情報処理学会研究報告   2003 ( 124 (2003-SLP-049) )   253 - 258   2003年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ、会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.

    CiNii Article

    researchmap

  • 汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価

    原直, 河口信夫, 武田一哉, 板倉文忠

    情報処理学会研究報告   2003 ( 14 (2002-SLP-045) )   131 - 136   2003年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    携帯情報端末(PDA)での音声認識の研究を進めるために,汎用音声認識エンジンJulius/JulianをPDA上に移植し,その性能評価を行った.その結果,孤立単語音声認識では,Linux上で動作させた場合に比べて認織率はわずかに低下するが,PDAで実時間の約1.9倍で90%の認識率を得ることができた.連続数字音声認識ではPDAで収録した音声で学習することにより,約99%の認識率を得た.

    CiNii Article

    researchmap

▼全件表示

講演・口頭発表等

  • 人対人の会話で自然な話題展開を支援するための対話戦略の検討

    前薗そよぎ, 原直, 阿部匡伸

    音学シンポジウム2021(情報処理学会 音声言語処理研究会)  2021年6月18日  情報処理学会

     詳細を見る

    開催年月日: 2021年6月18日 - 2021年6月19日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

    長塚弘亮, 川上滋央, 古寺寛志, 佐藤匡晃, 田中祐貴, 兒玉直紀, 原直, 皆木省吾

    日本顎顔面補綴学会 第38回総会・学術大会  2021年6月4日 

     詳細を見る

    開催年月日: 2021年6月3日 - 2021年6月5日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • ニューラル機械翻訳により推定された読み仮名・韻律記号を入力とする日本語 End-to-End 音声合成の評価

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2021年春季研究発表会  2021年3月11日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Evaluation of Concept Drift Adaptation for Acoustic Scene Classifier Based on Kernel Density Drift Detection and Combine Merge Gaussian Mixture Model

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    日本音響学会2021年春季研究発表会  2021年3月10日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 歌唱表現を付与できるBidirectional-LSTM を用いた歌声合成方式の検討

    金子隼人, 原直, 阿部匡伸

    日本音響学会2021年春季研究発表会  2021年3月10日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • TTSによる会話支援システムのための感圧センサを用いた手袋型入力デバイスの開発と入力速度の評価

    小林誠, 原直, 阿部匡伸

    情報処理学会 第190回ヒューマンコンピュータインタラクション研究発表会  2020年12月9日  情報処理学会

     詳細を見る

    開催年月日: 2020年12月8日 - 2020年12月9日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:淡路夢舞台国際会議場&オンライン  

    researchmap

  • Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 国際会議

    Katsuki Inoue, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2020  2020年12月  APSIPA

     詳細を見る

    開催年月日: 2020年12月7日 - 2020年12月10日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Auckland, New Zealand (Virtual/Online)  

    researchmap

    その他リンク: https://ieeexplore.ieee.org/document/9306250

  • Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 国際会議

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    The 2020 IEEE Region 10 Conference (IEEE-TENCON 2020)  2020年11月  IEEE

     詳細を見る

    開催年月日: 2020年11月16日 - 2020年11月19日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Osaka, Japan (Virtual/Online)  

    researchmap

  • Controlling the Strength of Emotions in Speech-like Emotional Sound Generated by WaveNet 国際会議

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Interspeech 2020  2020年10月  ISCA

     詳細を見る

    開催年月日: 2020年10月25日 - 2020年10月29日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Shanghai, China (Virtual/Online)  

    researchmap

  • パーキンソン病重症度推定のためのインソール型圧力センサを用いた時間的特徴量の検討

    林倖生, 原直, 阿部匡伸

    2020年度(第71回)電気・情報関連学会中国支部連合大会  2020年10月24日 

     詳細を見る

    開催年月日: 2020年10月24日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2020年秋季研究発表会  2020年9月11日  日本音響学会

     詳細を見る

    開催年月日: 2020年9月9日 - 2020年9月11日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    researchmap

  • WaveNetを用いた言語情報なし感情音声合成における感情の強さ制御の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2020年秋季研究発表会  2020年9月10日  日本音響学会

     詳細を見る

    開催年月日: 2020年9月9日 - 2020年9月11日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン  

    researchmap

  • 映像と音声を用いた議論への関与姿勢や肯定的・否定的態度の推定方式の検討

    金岡翼, 上原佑太郎, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)  2020年6月26日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月24日 - 2020年6月26日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • GPSデータのクラスタリングによる日常生活における場所の重要度の分析

    平田瑠,原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)  2020年6月25日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月24日 - 2020年6月26日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End 音声認識を用いた音声合成の半教師あり話者適応 国際共著

    井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

    音学シンポジウム2020(エキシビションASJ代替発表)  2020年6月7日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月6日 - 2020年6月7日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 話題の対象に対する親密度に応じて応答する音声対話システムの検討

    加藤大地, 原直, 阿部匡伸

    音学シンポジウム2020(情報処理学会 音声言語処理研究会)  2020年6月6日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月6日 - 2020年6月7日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • Semi-supervised speaker adaptation for end-to-end speech synthesis with the pretrained models 国際共著 国際会議

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

    ICASSP 2020  2020年5月  IEEE

     詳細を見る

    開催年月日: 2020年5月4日 - 2020年5月8日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Barcelona, Spain (Virtual/Online)  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための推定音素事後確率を用いた声質変換の検討

    荻野聖也, 原直, 阿部匡伸

    電子情報通信学会総合大会  2020年3月17日  電子情報通信学会

     詳細を見る

    開催年月日: 2020年3月17日 - 2020年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 言語情報なし感情合成音を学習に用いたCycleGANによる感情変換方式の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2020年春季研究発表会  2020年3月18日  日本音響学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End 音声認識を用いた音声合成の半教師あり話者適応 国際共著

    井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

    日本音響学会2020年春季研究発表会  2020年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • ウェアラブルデバイスによる曖昧な入力からのニューラル機械翻訳を用いた日本語文章推定方式

    渡邊淳,原直, 阿部匡伸

    情報処理学会研究報告  2020年3月16日  情報処理学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End⾳声認識を⽤いたEnd-to-End⾳声合成の性能評価 国際共著

    井上勝喜, 原直, 阿部匡伸, 渡部晋治

    第22回 ⽇本⾳響学会 関⻄⽀部若⼿研究者交流研究発表会  2019年11月30日  日本音響学会関西支部

     詳細を見る

    開催年月日: 2019年11月30日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients’ Speech

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月19日  APSIPA

     詳細を見る

    開催年月日: 2019年11月18日 - 2019年11月21日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • Speech-like Emotional Sound Generator by WaveNet 国際会議

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月  APSIPA

     詳細を見る

    開催年月日: 2019年11月18日 - 2019年11月21日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • WaveNet による言語情報を含まない感情音声合成方式における話者性の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2019年秋季研究発表会  2019年9月6日  日本音響学会

     詳細を見る

    開催年月日: 2019年9月4日 - 2019年9月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:立命館大BKCキャンパス(滋賀県草津市)  

    researchmap

  • 新たにデザインされた人工舌と解剖学的人工舌の効果ならびにその選択基準

    佐藤匡晃, 長塚弘亮, 川上滋央, 兒玉直紀, 原直, 阿部匡伸, 皆木省吾

    日本補綴歯科学会 中国・四国支部学術大会  2019年9月1日  日本補綴歯科学会 中国・四国支部

     詳細を見る

    開催年月日: 2019年8月31日 - 2019年9月1日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島県福山市  

    researchmap

  • A signal processing perspective on human gait: Decoupling walking oscillations and gestures 国際共著 国際会議

    Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

    The 4th International Conference on Interactive Collaborative Robotics (ICR 2019)  2019年8月  SPECOM

     詳細を見る

    開催年月日: 2019年8月20日 - 2019年8月25日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Istanbul, Turkey  

    researchmap

  • GPSデータに基づく日常生活における特別な行動の検出

    小林誠,原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)  2019年7月4日  情報処理学会

     詳細を見る

    開催年月日: 2019年7月3日 - 2019年7月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:磐梯熱海温泉華の湯(福島県)  

    researchmap

  • CNN Autoencoder から抽出したボトルネック特徴量を用いた環境音分類

    松原拓未, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)  2019年7月3日  情報処理学会

     詳細を見る

    開催年月日: 2019年7月3日 - 2019年7月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:磐梯熱海温泉華の湯(福島県)  

    researchmap

  • WaveNetによる言語情報を含まない感情音声合成方式の検討

    松本剣斗, 原直, 阿部匡伸

    音学シンポジウム2019 (SIG-MUS, SIG-SLP)  2019年6月23日  情報処理学会

     詳細を見る

    開催年月日: 2019年6月22日 - 2019年6月23日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:京都大学 吉田キャンパス(京都府)  

    researchmap

  • i-vectorに基づく賑わい音の推定方式の検討

    呉 セン陽, 朝田興平, 原直, 阿部匡伸

    音学シンポジウム2019 (SIG-MUS, SIG-SLP)  2019年6月22日  情報処理学会

     詳細を見る

    開催年月日: 2019年6月22日 - 2019年6月23日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:京都大学 吉田キャンパス(京都府)  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための Bidirectional LSTM-RNN に基づく音素補助情報を用いた声質変換方式の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会2019年春季研究発表会  2019年3月4日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための音素補助情報の推定方式の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    日本音響学会2019年春季研究発表会  2019年3月4日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

    井上勝喜, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2019年春季研究発表会  2019年3月3日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • ながら聴き用楽曲の作業負荷に及ぼす影響とその選択方式の検討

    高瀬郁, 阿部匡伸, 原直

    第121回SIGMUS研究会  2018年11月21日  情報処理学会

     詳細を見る

    開催年月日: 2018年11月21日 - 2018年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:ホテルこうしゅうえん(石川県輪島市)  

    researchmap

  • クラウドソーシングによる環境音マップ構築のための主観的な騒々しさ推定方式の検討

    原直, 阿部匡伸

    第17回情報科学技術フォーラム(FIT 2018)  2018年9月20日  情報処理学会

     詳細を見る

    開催年月日: 2018年9月19日 - 2018年9月21日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:福岡工業大学  

    researchmap

  • Speech Enhancement of Glossectomy Patient’s Speech using Voice Conversion Approach

    Masanobu Abe, Seiya Ogino, Hiroki Murakami, Sunao Hara

    日本生物物理学会第56回年会,シンポジウム:ヘルスシステムの理解と応用  2018年9月15日  日本生物物理学会

     詳細を見る

    開催年月日: 2018年9月15日 - 2018年9月17日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:岡山大学 津島キャンパス  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための補助情報の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会2018年秋季研究発表会  2018年9月12日  日本音響学会

     詳細を見る

    開催年月日: 2018年9月12日 - 2018年9月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大分大学 旦野原キャンパス  

    researchmap

  • DNN音声合成における感情付与方式の評価

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2018年秋季研究発表会  2018年9月12日  日本音響学会

     詳細を見る

    開催年月日: 2018年9月12日 - 2018年9月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大分大学 旦野原キャンパス  

    researchmap

  • Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient’s Speech Using Spectral Differential Modification in Voice Conversion

    Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2018  2018年9月5日  ISCA

     詳細を見る

    開催年月日: 2018年9月2日 - 2018年9月6日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hyderabad, India  

    researchmap

  • 音声と口唇形状を用いた声質変換による舌亜全摘出者の音韻明瞭度改善の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    音声研究会  2018年6月28日  電子情報通信学会

     詳細を見る

    開催年月日: 2018年6月28日 - 2018年6月29日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:信州大学 長野(工学)キャンパス  

    researchmap

  • 舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

    村上博紀,荻野聖也,原直,阿部匡伸,佐藤匡晃,皆木省吾

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • クラウドソーシングによる賑わい音識別方式のフィールド実験評価

    朝田興平,原直,阿部匡伸

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • DNN音声合成における感情付与のための継続時間長モデルの検討

    井上勝喜,原直,阿部匡伸,北条伸克,井島勇祐

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • Sound sensing using smartphones as a crowdsourcing approach

    Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

    APSIPA Annual Summit and Conference 2017  2017年12月15日  APSIPA

     詳細を見る

    開催年月日: 2017年12月12日 - 2017年12月15日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Kuala Lumpur, Malaysia  

    researchmap

  • An investigation to transplant emotional expressions in DNN-based TTS synthesis,

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    APSIPA Annual Summit and Conference 2017  2017年12月14日  APSIPA

     詳細を見る

    開催年月日: 2017年12月12日 - 2017年12月15日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Kuala Lumpur, Malaysia  

    researchmap

  • New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease,

    Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

    ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks (LocalRec 2017)  ACM

     詳細を見る

    開催年月日: 2017年11月7日 - 2017年11月10日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Redondo Beach, CA, USA  

    researchmap

  • DNN に基づく差分スペクトル補正を用いた声質変換による舌亜全摘出者の音韻明瞭性改善の検討

    村上博紀, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会2017年秋季研究発表会  2017年9月26日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • DNN による人間の感覚を考慮した騒々しさ推定方式に基づく騒音マップの作成

    小林将大, 原直, 阿部匡伸

    日本音響学会2017年秋季研究発表会  2017年9月26日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • DNN音声合成における話者と感情の情報を扱うためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2017年秋季研究発表会  2017年9月25日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • Prediction of subjective assessments for a noise map using deep neural networks

    Shota Kobayashi, Sunao Hara, Masanobu Abe

    2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2017)  2017年9月13日  ACM

     詳細を見る

    開催年月日: 2017年9月11日 - 2017年9月15日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Maui, Hawaii, USA  

    researchmap

  • Speaker Dependent Approach for Enhancing a Glossectomy Patient's Speech via GMM-based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2017  2017年8月23日  ISCA

     詳細を見る

    開催年月日: 2017年8月20日 - 2017年8月24日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Stockholm, Sweden  

    researchmap

  • 環境音収集に効果的なインセンティブを与える可視化方式の検討

    畠山晏彩子, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2017)  2017年6月28日  情報処理学会

     詳細を見る

    開催年月日: 2017年6月28日 - 2017年6月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:定山渓万世閣ホテルミリオーネ  

    researchmap

  • DNN音声合成における感情付与のためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    音声研究会  2017年6月22日  電子情報通信学会

     詳細を見る

    開催年月日: 2017年6月22日 - 2017年6月23日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東北大学 片平キャンパス  

    researchmap

  • 2つの粒度の生活圏に基づく見守りシステム

    鎌田成紀, 原直, 阿部匡伸

    電子情報通信学会総合大会  2017年3月22日  電子情報通信学会

     詳細を見る

    開催年月日: 2017年3月22日 - 2017年3月25日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学  

    researchmap

  • スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会2017年春季研究発表会  2017年3月16日  日本音響学会

     詳細を見る

    開催年月日: 2017年3月15日 - 2017年3月17日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:明治大学生田キャンパス  

    researchmap

  • DNNによる人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

    小林将大, 原直, 阿部匡伸

    日本音響学会2017年春季研究発表会  2017年3月16日  日本音響学会

     詳細を見る

    開催年月日: 2017年3月15日 - 2017年3月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:明治大学生田キャンパス  

    researchmap

  • Enhancing a Glossectomy Patient’s Speech via GMM-based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

    APSIPA Annual Summit and Conference 2016  2016年12月13日  APSIPA

     詳細を見る

    開催年月日: 2016年12月13日 - 2016年12月16日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Jeju, Korea  

    researchmap

  • A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model

    Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

    ASA/ASJ 5th Joint Meeting  2016年11月29日  米国音響学会/日本音響学会

     詳細を見る

    開催年月日: 2016年11月28日 - 2016年12月2日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Honolulu, Hawaii  

    researchmap

  • 基本周波数変形を考慮したスペクトル変換手法の検討

    床建吾, 阿部匡伸, 原直

    第18回IEEE広島支部学生シンポジウム(HISS 18th)  2016年11月19日  IEEE広島支部

     詳細を見る

    開催年月日: 2016年11月19日 - 2016年11月20日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:山口大学  

    researchmap

  • スマートフォンで収録した環境音に含まれるタップ音除去方式の検討

    朝田興平, 原直, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:富山大学五福キャンパス  

    researchmap

  • 重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討

    原直, 田中智康, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山大学五福キャンパス  

    researchmap

  • GMMに基づく声質変換を用いた舌亜全摘出者の音韻明瞭性改善の検討

    田中慧, 原直, 阿部匡伸, 皆木省吾

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山大学五福キャンパス  

    researchmap

  • RNNによる実環境データからのマルチ音響イベント検出

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:富山大学五福キャンパス  

    researchmap

  • LiBS: Lifelog browsing system to support sharing of memories

    Atsuya Namba, Sunao Hara, Masanobu Abe

    2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016)  2016年9月13日  ACM

     詳細を見る

    開催年月日: 2016年9月12日 - 2016年9月16日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Heidelberg, Germany  

    researchmap

  • Safety vs. Privacy: User Preferences from the Monitored and Monitoring Sides of a Monitoring System

    Shigeki Kamada, Sunao Hara, Masanobu Abe

    2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016)  2016年9月13日  ACM

     詳細を見る

    開催年月日: 2016年9月12日 - 2016年9月16日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Heidelberg, Germany  

    researchmap

  • 主観的評価に基づいた騒音マップ構築のためのクラウドソーシングによる環境音収集システム

    原直, 小林将大, 阿部匡伸

    音声研究会  2016年8月25日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年8月24日 - 2016年8月25日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:京都大学  

    researchmap

  • Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation

    Sunao Hara, Shota Kobayashi, Masanobu Abe

    IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016)  2016年7月15日  IEEE

     詳細を見る

    開催年月日: 2016年7月11日 - 2016年7月15日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Seattle, WA, USA  

    researchmap

  • GPSデータ匿名化レベルの主観的許容度を客観的に表現する指標の検討

    三藤優介, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)  2016年7月7日  情報処理学会

     詳細を見る

    開催年月日: 2016年7月6日 - 2016年7月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:鳥羽シーサイドホテル  

    researchmap

  • 人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

    小林将大, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)  2016年7月6日  情報処理学会

     詳細を見る

    開催年月日: 2016年7月6日 - 2016年7月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:鳥羽シーサイドホテル  

    researchmap

  • 滞在地ネットワークに基づく滞在地間の移動傾向を表現する尺度の検討

    大藤高史, 原直, 阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会  2016年5月13日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年5月12日 - 2016年5月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京大学  

    researchmap

  • 賑わい度推定のための環境音データベースの構築

    田中智康,原直,阿部匡伸

    2016年日本音響学会春季研究発表会  2016年3月11日  日本音響学会

     詳細を見る

    開催年月日: 2016年3月9日 - 2016年3月11日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:桐蔭横浜大学  

    researchmap

  • 生活圏を応用したプライバシーに配慮可能な見守り方式の検討

    鎌田成紀,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  2016年1月21日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年1月21日 - 2016年1月22日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:福岡工業大学  

    researchmap

  • A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding

    Masaki Yamaoka, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2015  2015年12月19日  APSIPA

     詳細を見る

    開催年月日: 2015年12月16日 - 2015年12月19日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Hong Kong  

    researchmap

  • 環境音検出器を用いた環境音の可視化に関する検討

    田中智康,原直,阿部匡伸

    第17回IEEE広島支部学生シンポジウム(HISS 17th)  IEEE広島支部

     詳細を見る

    開催年月日: 2015年11月21日 - 2015年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:岡山大学  

    researchmap

  • 心地よく話すことができる聞き役音声対話システムのための対話戦略

    齊藤椋太,原直,阿部匡伸

    第17回IEEE広島支部学生シンポジウム(HISS 17th)  IEEE広島支部

     詳細を見る

    開催年月日: 2015年11月21日 - 2015年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:岡山大学  

    researchmap

  • クラウドソーシングによる環境音収集システムを用いた予備収録実験

    原直,阿部匡伸,曽根原登

    2015年日本音響学会秋季研究発表会  2015年9月18日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:会津大学  

    researchmap

  • 冗長なシステム応答を用いたユーザの誤認識に頑健な音声対話システムに関する検討

    山岡将綺,原直,阿部匡伸

    2015年日本音響学会秋季研究発表会  2015年9月18日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:会津大学  

    researchmap

  • 音楽を用いた生活収録音の振り返り手法の検討

    鳥羽隼司,原直,阿部匡伸

    2015年日本音響学会秋季研究発表会  2015年9月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:会津大学  

    researchmap

  • A Sub-Band Text-to-Speech by Combining Sample-Based Spectrum with Statistically Generated Spectrum

    Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki and Hideyuki Mizuno

    Interspeech 2015  ISCA

     詳細を見る

    開催年月日: 2015年9月6日 - 2015年9月10日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Dresden, Germany  

    researchmap

  • Algorithm to estimate a living area based on connectivity of places with home

    Yuji Matsuo, Sunao Hara, Masanobu Abe

    HCI International 2015 

     詳細を見る

    開催年月日: 2015年8月2日 - 2015年8月7日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Los Angels, CA, USA  

    researchmap

  • Extraction of key segments from day-long sound data

    Akinori Kasai, Sunao Hara, Masanobu Abe

    HCI International 2015 

     詳細を見る

    開催年月日: 2015年8月2日 - 2015年8月7日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Los Angels, CA, USA  

    researchmap

  • LiBS:発見と気付きを可能とするライフログブラウジング方式

    難波敦也, 原直,阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2015)  2015年7月10日 

     詳細を見る

    開催年月日: 2015年7月8日 - 2015年7月10日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岩手県 安比高原  

    researchmap

  • 長期取得音からライフログとして残したい音の抽出方法

    笠井昭範,原直,阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2015)  2015年7月10日 

     詳細を見る

    開催年月日: 2015年7月8日 - 2015年7月10日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岩手県 安比高原  

    researchmap

  • 振り返り支援における効率的な映像要約のための自動収集ライフログ活用法

    大西杏菜,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年5月14日 - 2015年5月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:津田塾大学小平キャンパス  

    researchmap

  • Sound collection and visualization system enabled participatory and opportunistic sensing approaches

    Sunao Hara, Masanobu Abe, Noboru Sonehara

    2nd International Workshop on Crowd Assisted Sensing, Pervasive Systems and Communications (CASPer 2015)  IEEE

     詳細を見る

    開催年月日: 2015年3月27日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:St. Louis, Missouri, USA  

    researchmap

  • ミックスボイスの地声・裏声との類似度比較

    家村朋典,原直,阿部匡伸

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学理工学部  

    researchmap

  • 聴取者の主観評価に基づく音地図作成のための環境音収録

    原直,阿部匡伸,曽根原登

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:日本大学理工学部  

    researchmap

  • 高域部への素片スペクトルとHMM生成スペクトルの導入によるHMM合成音声の品質改善の検討

    稻井禎,原直,阿部匡伸,井島勇祐,宮崎昇,水野秀之

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学理工学部  

    researchmap

  • 移動経路のパターン分類による人の行動分析

    瀬藤諒,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式

    林啓吾,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • 滞在地と経路に着目した生活圏抽出法

    松尾雄二,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • クラウドセンシングデータによる地域の賑わい分析 -地域経済活性化-

    原直

    第7回国際ワークショップ 「社会イノベーションを誘発する情報・システム」  国立情報学研究所

     詳細を見る

    開催年月日: 2015年2月16日 - 2015年2月17日

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:国立情報学研究所  

    researchmap

  • Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization

    Masanobu Abe, Akihiko Hirayama, Sunao Hara

    IEEE International Conference on Consumer Electronics  IEEE

     詳細を見る

    開催年月日: 2015年1月9日 - 2015年1月12日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Las Vegas, USA  

    researchmap

  • 発話への関心の有無判別における聞き手の判別基準の有効性

    齊藤椋太, 原直, 阿部匡伸

    第17回日本音響学会関西支部 若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2014年12月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:関西大学  

    researchmap

  • ロック歌唱における「歪み声」と「ミックスボイス」の音響的特徴分析

    家村朋典,原直,阿部匡伸

    第17回日本音響学会関西支部 若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2014年12月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:関西大学  

    researchmap

  • A Hybrid Text-to-Speech Based on Sub-Band Approach

    Takuma Inoue, Sunao Hara, Masanobu Abe

    Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference (APSIPA ASC 2014)  Asia-Pacific Signal and Information Processing Association (APSIPA)

     詳細を見る

    開催年月日: 2014年12月9日 - 2014年12月12日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Cambodia  

    researchmap

  • 音素波形選択型音声合成方式に用いるデータベースサイズと主観評価との関係分析

    稻井禎, 原直, 阿部匡伸

    2014年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2014年9月3日 - 2014年9月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:北海学園大学  

    researchmap

  • クラウドセンシングにより収集された環境音のシンボル表現を用いた音地図構築手法

    原直, 阿部匡伸, 曽根原登

    2014年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2014年9月3日 - 2014年9月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:北海学園大学  

    researchmap

  • FLAG: 位置情報を基軸としたライフログ集約システム

    笠井昭範, 原直, 阿部匡伸

    ユビキタスコンピューティングシステム研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年6月28日 - 2014年6月29日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国立情報学研究所  

    researchmap

  • GPSデータから構築したネットワーク構造におけるノード次数に基づく行動分析法の検討

    藤岡大輔, 原直, 阿部匡伸

    ユビキタスコンピューティングシステム研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年5月29日 - 2014年5月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山国際会議場  

    researchmap

  • スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発

    原直,笠井昭範,阿部匡伸,曽根原登

    音声研究会(音学シンポジウム2014)  電子情報通信学会

     詳細を見る

    開催年月日: 2014年5月24日 - 2014年5月25日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学文理学部キャンパス 百周年記念館  

    researchmap

  • 車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

    山岡将綺, 原直, 阿部匡伸

    音声言語処理研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年5月22日 - 2014年5月23日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工業大学大岡山キャンパス  

    researchmap

  • 非負値行列因子分解によるPC操作ログからの勤務パタン抽出

    平山明彦, 原直, 阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会  電子情報通信学会

     詳細を見る

    開催年月日: 2014年5月15日 - 2014年5月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

    researchmap

  • クラウドソーシングによる環境音収集

    原直

    第15回 岡山情報通信技術研究会  岡山情報通信技術研究会

     詳細を見る

    開催年月日: 2014年4月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • New Approach to Emotional Information Exchange: Experience Metaphor Based on Life Logs

    Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

    The 12th IEEE International Conference on Pervasive Computing and Communications (PerCom 2014)  IEEE

     詳細を見る

    開催年月日: 2014年3月24日 - 2014年3月28日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Budapest, Hungary  

    researchmap

  • 他人との行動ログ比較による個人の行動特徴分析

    瀬藤諒, 阿部匡伸, 原直

    電子情報通信学会2014年総合大会  電子情報通信学会

     詳細を見る

    開催年月日: 2014年3月18日 - 2014年3月21日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 滞在地と経路に着目した生活圏抽出法の検討

    松尾雄二,原直,阿部匡伸

    情報処理学会第76回全国大会  2014年 

     詳細を見る

    開催年月日: 2014年3月11日 - 2014年3月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学  

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式の検討

    林啓吾,原直,阿部匡伸

    情報処理学会第76回全国大会  2014年 

     詳細を見る

    開催年月日: 2014年3月11日 - 2014年3月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学  

    researchmap

  • 音声波形の高域利用による HMM 音声合成方式の評価

    井上拓真,原直,阿部匡伸,井島勇祐,水野秀之

    2014年日本音響学会春季研究発表会  2014年 

     詳細を見る

    開催年月日: 2014年3月10日 - 2014年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:日本大学  

    researchmap

  • クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

    原直,笠井昭範,阿部匡伸,曽根原登

    電子情報通信学会 LOIS研究会  2014年 

     詳細を見る

    開催年月日: 2014年3月7日 - 2014年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 地理情報を活用したモバイル音声対話システムに関する研究

    原直

    情報処理学会 音声言語処理研究会(SIG–SLP第100回シンポジウム) 

     詳細を見る

    開催年月日: 2014年1月31日 - 2014年2月1日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • PC操作ログから抽出したソフトウェアの使用様態による働き方の分析

    平山明彦,原直,阿部匡伸

    第15回IEEE広島支部学生シンポジウム(HISS 15th)  2013年 

     詳細を見る

    開催年月日: 2013年11月

    記述言語:日本語   会議種別:ポスター発表  

    開催地:鳥取大学  

    researchmap

  • GPSデータの滞在地に着目した行動振り返り支援方式

    林啓吾,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • GPSデータを用いた生活圏の動的生成のためのデータ量に関する検討

    松尾雄二,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 混合正規分布を用いた声質変換法における分布数とスペクトル変換精度との関係性の検討

    遠藤一輝,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 位置情報による行動分析を行うための経由地検出の検討

    瀬藤諒,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • スペクトル包絡と基本周波数の変換が音声の個人性に与える影響の検討

    河井啓介, 原直, 阿部匡伸

    2013年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年9月25日 - 2013年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:豊橋技術科学大学  

    researchmap

  • 音声波形の高域利用によるHMM音声合成の高品質化

    井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

    2013年日本音響学会秋季研究発表会 

     詳細を見る

    開催年月日: 2013年9月25日 - 2013年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 音響信号とマルチセンサー信号を利用したスマートフォンによる自動車の燃費推定

    難波祥平,原直,阿部匡伸

    音声研究会  電子情報通信学会/日本音響学会

     詳細を見る

    開催年月日: 2013年5月16日 - 2013年5月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力棄却モデルの可搬性の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会 2013年春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年3月13日 - 2013年3月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工科大学  

    researchmap

  • HMM音声合成と波形音声合成の混在による方式の評価

    井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

    日本音響学会 2013年春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年3月13日 - 2013年3月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工科大学  

    researchmap

  • GPSデータから抽出した滞在地のネットワークにおける個人の特徴分析

    藤岡大輔, 原直, 阿部匡伸

    電子情報通信学会 ライフインテリジェンスとオフィス情報システム研究会(LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2013年3月7日 - 2013年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 他者のライフログからの類似した印象を持つイベント抽出法の検討

    濱野和人, 原直, 阿部匡伸, 藤岡大輔, 望月理香, 渡部智樹

    電子情報通信学会 ライフインテリジェンスとオフィス情報システム研究会(LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2013年3月7日 - 2013年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Bag-of-Wordsを用いた音声情報案内システム無効入力棄却モデルの可搬性の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    第15回日本音響学会関西支部若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2012年12月9日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • Development of a toolkit handling multiple speech-oriented guidance agents for mobile applications

    Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

    The 4th International Workshop on Spoken Dialog Systems (IWSDS2012) 

     詳細を見る

    開催年月日: 2012年11月28日 - 2012年11月30日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Paris, France  

    researchmap

  • Evaluation of invalid input discrimination using BOW for speech-oriented guidance system

    Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

    The 4th International Workshop on Spoken Dialog Systems (IWSDS2012) 

     詳細を見る

    開催年月日: 2012年11月28日 - 2012年11月30日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Paris, France  

    researchmap

  • 音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会 2012年秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2012年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

    原直,川波弘道,猿渡洋,鹿野清宏

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • クラウド時代の新しい音声研究パラダイム

    秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原直,堀貴明

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:シンポジウム・ワークショップ パネル(指名)  

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

    真嶋温佳,トーレス・ラファエル,川波弘道,原直,松井知子,猿渡洋,鹿野清宏

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Causal analysis of task completion erros in spoken music retrieval interactions

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    LREC 2012  2012年  ELDA

     詳細を見る

    開催年月日: 2012年5月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Istanbul, Turkey  

    researchmap

  • Multi-band speech recognition using band-dependent confidence measures of blind source separation

    Atsushi Ando, Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    The Acoustics 2012  2012年 

     詳細を見る

    開催年月日: 2012年5月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hong Kong  

    researchmap

  • 携帯端末用音声情報案内システムのためのマイク入力に関する調査

    中清行,原直,川波弘道,猿渡洋,鹿野清宏

    電子情報通信学会 総合大会 情報・システムソサイエティ特別企画 学生ポスターセッション  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 周波数帯域ごとの音源分離信頼度を利用したマルチバンド音声認識

    安藤厚志,大橋宏正,原直,北岡教英,武田一哉

    2012年春季研究発表会  2012年  日本音響学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 多様な利用環境における音声情報案内サービスソフトウェアの開発

    原直,川波弘道,猿渡洋,鹿野清宏

    電子情報通信学会総合大会  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • ブラインド音源分離の信頼度を用いたマルチバンド音声認識

    安藤厚志,大橋宏正,原直,北岡教英,武田一哉

    音声研究会  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年2月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    ASRU 2011  2011年  IEEE

     詳細を見る

    開催年月日: 2011年12月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hawaii  

    researchmap

  • Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    APSIPA-ASC 2011  2011年  APSIPA

     詳細を見る

    開催年月日: 2011年10月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Xi'an, China  

    researchmap

  • On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    IWSDS 2011  2011年 

     詳細を見る

    開催年月日: 2011年9月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Granada, Spain  

    researchmap

  • Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    Interspeech 2011  2011年  ISCA

     詳細を見る

    開催年月日: 2011年8月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Florence, Italy  

    researchmap

  • Music recommendation system based on human-to-human conversation recognition

    Hiromasa OHASHI, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    HCIAmI'11  2011年 

     詳細を見る

    開催年月日: 2011年7月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Nottingham, U.K.  

    researchmap

  • 雑談音声の認識に基づく楽曲連想再生システム

    大橋宏正,原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • MLLR変換行列に基づいた音響特徴量生成による音響モデル学習

    伊藤新,原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムにおける発話・行動タグN-gram を用いた課題未達成対話の検出手法と分析

    原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル

    伊藤新,北岡教英,原直,武田一哉

    音声言語シンポジウム  2010年  情報処理学会

     詳細を見る

    開催年月日: 2010年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 雑談音声の常時認識による楽曲提案システム

    大橋宏正,北岡教英,原直,武田一哉

    音声研究会  2010年  電子情報通信学会

     詳細を見る

    開催年月日: 2010年10月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    INTERSPEECH2010  2010年9月  ISCA

     詳細を見る

    開催年月日: 2010年9月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Makuhari, Japan  

    researchmap

  • 音声対話システムの発話系列N-gram を用いた課題未達成対話のオンライン検出

    原直,北岡教英,武田一哉

    2011年秋季研究発表会  2010年  日本音響学会

     詳細を見る

    開催年月日: 2010年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Rapid acoustic model adaptation using inverse MLLR-based feature generation

    Arata ITO, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    The 20th International Congress on Acoustics (ICA2010)  2010年8月 

     詳細を見る

    開催年月日: 2010年8月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Sydney, Australia  

    researchmap

  • Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    7th conference on International Language Resources and Evaluation (LREC'10)  2010年5月  ELDA

     詳細を見る

    開催年月日: 2010年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Valleta, Malta  

    researchmap

  • MLLR 変換行列により生成した音声特徴量に基づく高速モデル適応

    伊藤新,原直,北岡教英,武田一哉

    2011年秋季研究発表会  2010年  日本音響学会

     詳細を見る

    開催年月日: 2010年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 楽曲連想再生のための文書特徴量と音響特徴量の対応付け

    高橋量衛, 大石康智, 原直, 北岡教英, 武田一哉

    第4回音声ドキュメント処理ワークショップ  2010年 

     詳細を見る

    開催年月日: 2010年2月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

    原直,北岡教英,武田一哉

    音声言語シンポジウム  2009年  情報処理学会

     詳細を見る

    開催年月日: 2009年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 複数音響モデルからの最適選択による音声認識

    伊藤新,原直,宮島千代美,北岡教英,武田一哉

    平成21年度電気関係学会 東海支部連合大会  2009年 

     詳細を見る

    開催年月日: 2009年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 楽曲間の主観的類似度と音響的類似度との関連付けに関する検討

    平賀悠介,大石康智,原直,武田一哉

    2009年秋季研究発表会  2009年  日本音響学会

     詳細を見る

    開催年月日: 2009年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムのユーザ満足度推論におけるネットワークモデルの構築と評価

    原直,北岡教英,武田一哉

    2009年春季研究発表会  2009年  日本音響学会

     詳細を見る

    開催年月日: 2009年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル

    原直,北岡教英,武田一哉

    音声言語シンポジウム  2008年  情報処理学会

     詳細を見る

    開催年月日: 2008年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Data collection and usability study of a PC-based speech application in various user environments

    Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Oriental-COCOSDA 2008  2008年11月 

     詳細を見る

    開催年月日: 2008年11月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Kyoto, Japan  

    researchmap

  • In-car speech data collection along with various multimodal signals

    Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

    The 6th International Language Resources and Evaluation (LREC08)  2008年5月  ELDA

     詳細を見る

    開催年月日: 2008年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Marrakech Morocco  

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 国際会議

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月  APSIPA

     詳細を見る

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • 舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

    村上博紀, 荻野聖也, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会2018年春季研究発表会  2018年3月26日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • クラウドソーシングによる賑わい音識別方式のフィールド実験評価

    朝田興平, 原直, 阿部匡伸

    日本音響学会2018年春季研究発表会  2018年3月25日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • DNN音声合成における感情付与のための継続時間長モデルの検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2018年春季研究発表会  2018年3月25日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • An online customizable music retrieval system with a spoken dialogue interface

    Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

    4th Joint Meeting of ASA/ASJ  2006年11月 

     詳細を見る

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System

    Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Oriental-COCOSDA 2005  2005年12月 

     詳細を見る

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

▼全件表示

Works(作品等)

  • ChartEx

    原直

    2017年5月

     詳細を見る

    作品分類:ソフトウェア   発表場所:GitHub  

    Excel Addin for export chart as image file such as png, jpeg, and pdf.

    researchmap

  • TTX KanjiMenu Plugin

    原直

    2007年3月

     詳細を見る

    作品分類:ソフトウェア  

    Tera Termでサーバで利用する漢字コードの選択をメニューから選択できるようにするためのプラグインです。現在は、Sourceforge.jpのTera Termプロジェクトによってメンテナンスがなされています。

    researchmap

  • Pocket Julius

    原直

    2003年1月

     詳細を見る

    作品分類:ソフトウェア  

    このパッケージは大語彙音声認識デコーダ Julius を Microsoft Pocket PC 2002 環境で動くようにした Pocket Julius のデモパッケージです.

    researchmap

受賞

  • 社会貢献賞

    2021年3月   岡山大学工学部  

     詳細を見る

  • ベストティーチャー賞

    2020年3月   岡山大学工学部  

     詳細を見る

  • 教育貢献賞

    2019年3月   岡山大学工学部  

    原直

     詳細を見る

  • 学会活動貢献賞

    2019年3月   日本音響学会  

    原直

     詳細を見る

  • FIT奨励賞

    2018年9月   第17回情報科学技術フォーラム  

    原直

     詳細を見る

  • 優秀論文賞

    2016年8月   情報処理学会 DICOMO2016  

    小林将大, 原直, 阿部匡伸

     詳細を見る

  • 教育貢献賞

    2016年3月   岡山大学工学部  

    原直

     詳細を見る

  • 平成25年度岡山工学振興会科学技術賞

    2013年7月   公益財団法人岡山工学振興会  

    原直

     詳細を見る

  • 平成16年秋季研究発表会 ポスター賞

    2004年9月   日本音響学会  

    原直

     詳細を見る

▼全件表示

共同研究・競争的資金等の研究

  • 協調的ライブ記録が支えるアクティブラーニング@オンラインの技術研究

    研究課題/領域番号:21K12155  2021年04月 - 2024年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4030000円 ( 直接経費:3100000円 、 間接経費:930000円 )

    researchmap

  • 感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

    研究課題/領域番号:21K11963  2021年04月 - 2024年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4160000円 ( 直接経費:3200000円 、 間接経費:960000円 )

    researchmap

  • 観光地の雰囲気可視化を可能とする簡易なアノテーションに基づく深層学習方式の研究

    研究課題/領域番号:20K12079  2020年04月 - 2023年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    原 直

      詳細を見る

    担当区分:研究代表者 

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    researchmap

  • 音響信号から学修者の活性度を測るPBL指導支援システムの開発

    研究課題/領域番号:18K02862  2018年04月 - 2022年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4420000円 ( 直接経費:3400000円 、 間接経費:1020000円 )

    本研究では、音情報処理の技術を応用し、大学等の高等教育機関で導入が進むPBLの指導者支援システムを開発する。
    学修者の活性度抽出アルゴリズムの一部として、CNN Autoencoderによる音分類方式の検討を進めた。特に、収録環境の異なる2つのコーパスを用いた実験により、単に両者を混ぜたコーパスからモデル学習をするのではなく、Autoencoderによる特徴量抽出を介することで、より高い分類性能を持つモデルを学習できることを示した。画像と音声を含む会議データを収録し、その画像としての特徴と音声としての特徴を併用することで、会議参加者の発話意図の推定や参加姿勢の良し悪しを推定する検討を行った。
    PBLのデータ取集と協調的アノテーションの実現の取り組みとして、グループワークに取り組む学生個々の参加情報記録システムを開発した。システムでは,指導者がタブレット端末に提示された学生の顔画像をタッチ操作することで、その学生のグループワークへの参加状況を記録することが可能である。本研究では、発言や相槌の回数、グループワークに対する貢献度を記録できるインタフェースを設計した。システムで提示する顔画像は、360度全方位の撮影が可能なビデオカメラで撮影したパノラマ画像から抽出する。実験では、協力者に依頼し、実際のグループワークを撮影した。また、データの利活用を円滑にするため、音声を匿名化する声質変換システムの開発を行った。提案システムは、(a) マイクロホンアレイを用いた対話音声の収録 (b) 各話者の音声に含まれる特徴量の抽出 (c) 深層学習による音声の声質変換を実現する。(c)では、ニューラルネットワークに基づいた敵対的生成ネットワークのアルゴリズムであるCycle-Consistent Adversarial Networksを用いた。

    researchmap

  • ディープニューラルネットワークによる舌亜全摘出者の音韻明瞭性改善の研究

    研究課題/領域番号:18K11376  2018年04月 - 2022年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直, 皆木 省吾

      詳細を見る

    担当区分:研究分担者 

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    研究計画調書に記載した課題に関して,令和元年度(2019年度)に実施した内容は下記の通り.
    (課題1)音韻明瞭度の改善 「①-1 調音結合の制約をDNNによりモデル化」については,両方向LSTMと前向きLSTMの性能を比較した結果,両方向は明瞭性よりは自然性,高品質化の効果が大きいことが明らかになった。「①-2唇情報表現の検討」については,音声のスペクトル情報と唇の画像情報の異なる特徴量を扱うことからDNNによる方式で検討を進めた。まず, Kinectにより取得した唇の輪郭とスペクトル情報を利用した結果,母音の明瞭性が向上することが明らかとなった。子音に比べて母音の継続時間長が長いためと考えられる。次に,DNNの特徴を利用して,音韻の情報を補助的に利用する方法を検討した。実験では,正解となる音韻情報を与えて改善の可能性を確認した結果,破裂音,摩擦音等の子音の明瞭性が向上することが明らかとなった。
    (課題2)患者の発話負担軽減.「②-2疑似舌亜全摘出者音声データベースの構築」については,昨年度作成した下歯を覆うプレートを利用して,3名分の疑似舌亜全摘出者の音声と唇映像の同時収録データベースを構築した.
    (課題3)リアルタイム動作.「③-2差分スペクトル利用による誤分析対処」については,WORLD方式によって分析し,3層のDNNによるスペクトル推定し,残差信号を利用した声質変換方式により,100ミリ秒の遅れてリアルタイム処理できることが明らかとなった。

    researchmap

  • 地域活性化政策立案のための音響信号による“賑い度”調査プラットフォームの研究開発

    2015年07月 - 2018年03月

    総務省  戦略的情報通信研究開発推進事業 SCOPE(地域ICT振興型研究開発) 

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    researchmap

  • PBLの個人評価を目的とする活動音の可視化技術

    研究課題/領域番号:15K01069  2015年04月 - 2018年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4680000円 ( 直接経費:3600000円 、 間接経費:1080000円 )

    本研究では、PBL(Project-Based Learning; プロジェクト型学習)に参加する学修者の評価を支援する手法を音情報の可視化を通じて実現するための技術開発を行った。対話音声を用いたグループワークにおけるアクティビティの自動検出法を検討した。その結果を応用し、ウェアラブル音声収録端末を用いたグループワーク状況提示システムを試作した。加えて、深層学習型ニューラルネットワークに基づく音源情報可視化手法を検討した。

    researchmap

  • ライフログに基づくプライバシーを考慮した高度な見守りシステムの研究

    研究課題/領域番号:15K00128  2015年04月 - 2018年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4420000円 ( 直接経費:3400000円 、 間接経費:1020000円 )

    少子高齢化社会への移行に伴い見守りシステムの必要性が高まっている。本研究では、プライバシーを考慮できる見守りシステムを検討した。特徴は、①長期間に渡って蓄積したGPSデータからユーザの生活圏を自動推定し、②生活圏を量子化(GeoHex)表現することでプライバシ制御を可能とし、③見守る量子化レベルをユーザの行動に基づいて適応的に変更できる点にある。生活圏の推定アルゴリズムはF値0.85程度の性能を得た。また、見守る側と見守られる側での量子化レベルの好みの実験を行い、見守られる側ではユーザ依存性が大きいことを明らかにした。

    researchmap

  • 自動車運転状況の自動推定に基づく安全性に配慮した音声対話システムの研究

    研究課題/領域番号:26730092  2014年04月 - 2017年03月

    日本学術振興会  科学研究費助成事業 若手研究(B)  若手研究(B)

    原 直

      詳細を見る

    担当区分:研究代表者 

    配分額:3640000円 ( 直接経費:2800000円 、 間接経費:840000円 )

    以下を実施した.
    (1)運転者の体や車両本体にとりつけたセンサから得られる生体信号や運転情報信号を用いて運転負荷の推定.スマートフォンで得られるセンサの利用を想定した運転負荷推定.(2)ユーザ負荷の観点で運転中の利用に適した対話戦略を評価.対話の主導権の方式と確認発話の方式を組み合わせた客観評価.(3)対話システムとして評価するための主観評価.特に,運転を模擬した動作と音声対話システムの利用という二重タスク課題における主観評価.(4)ユーザ負荷の推定結果を組み込める柔軟な対話戦略の選択方式を実装.グラフ探索に基づく対話戦略を導入.客観評価実験と主観評価実験による性能評価.

    researchmap

▼全件表示

 

担当授業科目

  • ディジタル信号処理 (2021年度) 第4学期  - 月1,月2,木1,木2

  • プログラミング演習1 (2021年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2021年度) 第2学期  - 水1,水2,水3

  • ヘルスシステム統合科学専門英語 (2021年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2021年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 月1~2

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 木1~2

  • 情報工学実験B (メディア処理) (2021年度) 第3学期  - 火3,火4,火5,火6,火7,木3,木4,木5,木6,木7

  • 音声情報処理特論Ⅰ (2021年度) 前期  - 木5~6

  • 音声情報処理特論Ⅱ (2021年度) 前期  - 木5~6

  • プログラミング演習 (2020年度) 1・2学期  - 水1,水2,水3

  • プログラミング演習1 (2020年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2020年度) 第2学期  - 水1,水2,水3

  • ヘルスシステム統合科学専門英語 (2020年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2020年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 月1,月2

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 木1,木2

  • 情報工学実験B (メディア処理) (2020年度) 第3学期  - 火3,火4,火5,火6,木3,木4,木5,木6

  • 情報工学実験第三 (2020年度) 第3学期  - 火3,火4,火5,火6

  • 情報工学実験第四 (2020年度) 第3学期  - 木3,木4,木5,木6

  • 音声情報処理特論Ⅰ (2020年度) 前期  - 木5,木6

▼全件表示