2024/10/27 更新

写真a

ハラ スナオ
原 直
HARA Sunao
所属
環境生命自然科学学域 准教授
職名
准教授
プロフィール

2003年名古屋大学工学部電気電子情報工学科卒業.
2005年名古屋大学大学院情報科学研究科博士前期課程修了.
2011年同大学大学院情報科学研究科博士後期課程修了.
同年から2012年奈良先端科学技術大学院大学情報科学研究科 助教.
2012年岡山大学大学院自然科学研究科 助教,
2019年岡山大学大学院ヘルスシステム統合科学研究科 助教,
2021年同大学学術研究院ヘルスシステム統合科学学域 助教,
2024年同大学学術研究院環境生命自然科学学域 准教授,現在に至る.
音声認識,音声合成,音声対話,ライフログに関する研究に従事.
2004年日本音響学会ポスター賞,2016年DICOMO2016優秀論文賞,2018年FIT奨励賞受賞.
IEEE,日本音響学会,電子情報通信学会,情報処理学会,ヒューマンインタフェース学会各会員.

外部リンク

学位

  • 博士(情報科学) ( 名古屋大学大学院 情報科学研究科 )

研究キーワード

  • ヒューマンインタフェース

  • 音声対話

  • 音声認識

  • ライフログ

  • 音響シーン分析

  • 音響イベント検出

  • 深層学習

  • 機械学習

  • 音声情報処理

  • 音声対話システム

研究分野

  • 情報通信 / 知能情報学

  • 情報通信 / ウェブ情報学、サービス情報学

  • 情報通信 / 知覚情報処理

経歴

  • 岡山大学   学術研究院環境生命自然科学学域   准教授

    2024年4月 - 現在

      詳細を見る

  • 岡山大学   大学院ヘルスシステム統合科学研究科   助教

    2019年4月 - 2024年4月

      詳細を見る

    国名:日本国

    researchmap

  • 岡山大学   大学院自然科学研究科   助教

    2012年9月 - 2019年3月

      詳細を見る

    国名:日本国

    researchmap

  • 奈良先端科学技術大学院大学   助教

    2011年11月 - 2012年9月

      詳細を見る

所属学協会

  • IEEE

    2016年6月 - 現在

      詳細を見る

  • 電子情報通信学会

    2012年2月 - 現在

      詳細を見る

  • 情報処理学会

    2007年 - 現在

      詳細を見る

  • 日本音響学会

    2004年 - 現在

      詳細を見る

  • 人工知能学会

    2024年5月 - 現在

      詳細を見る

  • ヒューマンインタフェース学会

    2005年 - 2022年12月

      詳細を見る

▼全件表示

委員歴

  • 日本音響学会   編集委員会 会誌部会 委員  

    2023年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会 関西支部   第24回若手研究者交流研究発表会 実行委員長  

    2021年4月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   広報・電子化委員会 委員  

    2013年10月 - 現在   

      詳細を見る

    団体区分:学協会

    電子化・広報推進委員会

    researchmap

  • 日本音響学会   研究発表会準備委員会 委員  

    2023年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2023年春季研究発表会 遠隔開催実行委員会 委員  

    2022年12月 - 2023年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2022年春季研究発表会 遠隔開催実行委員会 委員  

    2021年10月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2021年秋季研究発表会 遠隔開催実行委員会 委員  

    2021年7月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   2021年春季研究発表会 遠隔開催実行委員会 委員  

    2020年11月 - 2021年3月   

      詳細を見る

  • 日本音響学会   2020年秋季研究発表会 遠隔開催実行委員会 委員  

    2020年7月 - 2020年9月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 電子情報通信学会   ソサイエティ論文誌編集委員会 査読委員  

    2017年8月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 情報処理学会 中国支部   支部運営委員会 委員  

    2015年5月 - 2019年5月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   編集委員会 査読委員  

    2014年2月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会 関西支部   若手研究者交流研究発表会 実行委員  

    2011年11月 - 2022年3月   

      詳細を見る

    団体区分:学協会

    researchmap

  • 日本音響学会   学生・若手フォーラム幹事会  

    2007年3月 - 2012年3月   

      詳細を見る

    団体区分:学協会

    researchmap

▼全件表示

 

論文

  • Explicit Prosody Control to Realize Discourse Focus in End-to-End Text-to-Speech 査読 国際誌

    Takumi WADA, Sunao HARA, Masanobu ABE

    IEEE International Workshop on Machine Learning for Signal Processing   2024年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Speech Synthesis Using Ambiguous Inputs From Wearable Keyboards 査読 国際誌

    Matsuri Iwasaki, Sunao Hara, Masanobu Abe

    2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023)   1172 - 1178   2023年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a new application in speech communication using text-to-speech (TTS), and the goal is to enable dysarthria, articulation disorder, or persons who have difficulty in speaking to communicate anywhere and anytime using speech to express their thoughts and feelings. To achieve this goal, an input method is required. Thus, we propose a new text-entry method based on three concepts. First, from an easy-to-carry perspective, we used a wearable keyboard that inputs digits from 0 to 9 in decimal notation according to 10-finger movements. Second, from a no-training perspective, users input sentences in a way of touch typing using the wearable keyboard. Following this method, we obtained a sequence of numbers corresponding to the sentence. Third, a neural machine translation (NMT) method is applied to estimate texts from the sequence of numbers. The NMT was trained using two datasets; one is a Japanese-English parallel corpus containing 2.8 million pairs of sentences, which were extracted from TV and movie subtitles, while the other is a Japanese text dataset containing 32 million sentences, which were extracted from a question-and-answer platform. Using the model, phonemes and accent symbols were estimated from a sequence of numbers. Thus, the result accuracy in symbol levels was 91.48% and 43.45% of all the sentences were completely estimated with no errors. To subjectively evaluate feasibility of the NMT model, a two-person word association game was conducted; one gave hints using synthesized speech that is generated from symbols estimated by NMT, while the other guessed answers. As a result, 67.95% of all the quizzes were correctly answered, and experiment results show that the proposed method has the potential for dysarthria to communicate with TTS using a wearable keyboard.

    DOI: 10.1109/APSIPAASC58517.2023.10317228

    Scopus

    researchmap

  • Speech-Emotion Control for Text-to-Speech in Spoken Dialogue Systems Using Voice Conversion and x-vector Embedding 査読 国際誌

    Shunichi Kohara, Masanobu Abe, Sunao Hara

    2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023)   2280 - 2286   2023年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose an algorithm to control both speaker individuality and emotional expressions in synthesized speech, where the most important feature is the controllability of intensity in emotional expressions. An aim of the proposed algorithm is to generate various responses including emotions in text-to-speech (TTS) for spoken dialogue systems (SDS), which results in making the system more human-like. An idea is to control emotion and its intensity in line with the user's utterances. For example, when a user happily talks to SDS, the agent of the SDS responses with happy voice. Generally, voice quality of a user and the agent are different. Therefore, the proposed algorithm consists of two steps: (1) voice conversion to change speaker individuality including emotional expressions and (2) TTS with x-vector acting as an embedding vector to mainly control speech quality related to the intensity of emotions. Evaluation experiments are carried out using a scenario of a spoken dialogue system, where a teacher system of TTS encourages or cheers up students according to students' utterances. The experiment results showed that TTS can successfully reproduce the emotion and its intensity that are extracted from students' utterances, while maintaining the teacher's speaker individuality.

    DOI: 10.1109/APSIPAASC58517.2023.10317413

    Scopus

    researchmap

  • Sound map of urban areas recorded by smart devices: case study at Okayama and Kurashiki 招待 国際誌

    Sunao Hara, Masanobu Abe

    Proceedings of the 52nd International Congress and Exposition on Noise Control Engineering (Inter-Noise 2023)   1 - 12   2023年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Predictions for sound events and soundscape impressions from environmental sound using deep neural networks 招待 国際誌

    Sunao Hara, Masanobu Abe

    Proceedings of the 52nd International Congress and Exposition on Noise Control Engineering (Inter-Noise 2023)   1 - 12   2023年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Prediction method of Soundscape Impressions using Environmental Sounds and Aerial Photographs 査読 国際誌

    Yusuke Ono, Sunao Hara, Masanobu Abe

    2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)   1222 - 1227   2022年11月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.23919/apsipaasc55919.2022.9980290

    researchmap

    その他リンク: https://arxiv.org/abs/2209.04077

  • Incremental Audio Scene Classifier Using Rehearsal-Based Strategy 査読 国際誌

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    2022 IEEE 10th Global Conference on Consumer Electronics (GCCE)   69 - 623   2022年10月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    researchmap

  • Speech-Like Emotional Sound Generation Using WaveNet 査読

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    IEICE Transactions on Information and Systems   E105.D ( 9 )   1581 - 1589   2022年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Institute of Electronics, Information and Communications Engineers (IEICE)  

    In this paper, we propose a new algorithm to generate Speech-like Emotional Sound (SES). Emotional expressions may be the most important factor in human communication, and speech is one of the most useful means of expressing emotions. Although speech generally conveys both emotional and linguistic information, we have undertaken the challenge of generating sounds that convey emotional information alone. We call the generated sounds "speech-like," because the sounds do not contain any linguistic information. SES can provide another way to generate emotional response in human-computer interaction systems. To generate "speech-like" sound, we propose employing WaveNet as a sound generator conditioned only by emotional IDs. This concept is quite different from the WaveNet Vocoder, which synthesizes speech using spectrum information as an auxiliary feature. The biggest advantage of our approach is that it reduces the amount of emotional speech data necessary for training by focusing on non-linguistic information. The proposed algorithm consists of two steps. In the first step, to generate a variety of spectrum patterns that resemble human speech as closely as possible, WaveNet is trained with auxiliary mel-spectrum parameters and Emotion ID using a large amount of neutral speech. In the second step, to generate emotional expressions, WaveNet is retrained with auxiliary Emotion ID only using a small amount of emotional speech. Experimental results reveal the following: (1) the two-step training is necessary to generate the SES with high quality, and (2) it is important that the training use a large neutral speech database and spectrum information in the first step to improve the emotional expression and naturalness of SES.

    DOI: 10.1587/transinf.2021edp7236

    Web of Science

    researchmap

    その他リンク: https://www.webofscience.com/wos/woscc/full-record/WOS:000852731400008

  • Concept drift adaptation for audio scene classification using high-level features 査読 国際誌

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    2022 IEEE International Conference on Consumer Electronics (ICCE)   2022年1月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/icce53296.2022.9730332

    researchmap

  • Acoustic Scene Classifier Based on Gaussian Mixture Model in the Concept Drift Situation 査読 国際誌

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    Advances in Science, Technology and Engineering Systems Journal   6 ( 5 )   167 - 176   2021年9月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:ASTES Journal  

    DOI: 10.25046/aj060519

    researchmap

  • Phonetic and Prosodic Information Estimation from Texts for Genuine Japanese End-to-End Text-to-Speech 査読 国際誌

    Naoto Kakegawa, Sunao Hara, Masanobu Abe, Yusuke Ijima

    Interspeech 2021   126 - 130   2021年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    The biggest obstacle to develop end-to-end Japanese text-to-speech (TTS) systems is to estimate phonetic and prosodic information (PPI) from Japanese texts. The following are the reasons: (1) the Kanji characters of the Japanese writing system have multiple corresponding pronunciations, (2) there is no separation mark between words, and (3) an accent nucleus must be assigned at appropriate positions. In this paper, we propose to solve the problems by neural machine translation (NMT) on the basis of encoder-decoder models, and compare NMT models of recurrent neural networks and the Transformer architecture. The proposed model handles texts on token (character) basis, although conventional systems handle them on word basis. To ensure the potential of the proposed approach, NMT models are trained using pairs of sentences and their PPIs that are generated by a conventional Japanese TTS system from 5 million sentences. Evaluation experiments were performed using PPIs that are manually annotated for 5,142 sentences. The experimental results showed that the Transformer architecture has the best performance, with 98.0% accuracy for phonetic information estimation and 95.0% accuracy for PPI estimation. Judging from the results, NMT models are promising toward end-to-end Japanese TTS.

    DOI: 10.21437/interspeech.2021-914

    Web of Science

    researchmap

  • Model architectures to extrapolate emotional expressions in DNN-based text-to-speech 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    Speech Communication   126   35 - 43   2021年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Elsevier BV  

    This paper proposes architectures that facilitate the extrapolation of emotional expressions in deep neural network (DNN)-based text-to-speech (TTS). In this study, the meaning of “extrapolate emotional expressions” is to borrow emotional expressions from others, and the collection of emotional speech uttered by target speakers is unnecessary. Although a DNN has potential power to construct DNN-based TTS with emotional expressions and some DNN-based TTS systems have demonstrated satisfactory performances in the expression of the diversity of human speech, it is necessary and troublesome to collect emotional speech uttered by target speakers. To solve this issue, we propose architectures to separately train the speaker feature and the emotional feature and to synthesize speech with any combined quality of speakers and emotions. The architectures are parallel model (PM), serial model (SM), auxiliary input model (AIM), and hybrid models (PM&AIM and SM&AIM). These models are trained through emotional speech uttered by few speakers and neutral speech uttered by many speakers. Objective evaluations demonstrate that the performances in the open-emotion test provide insufficient information. They make a comparison with those in the closed-emotion test, but each speaker has their own manner of expressing emotion. However, subjective evaluation results indicate that the proposed models could convey emotional information to some extent. Notably, the PM can correctly convey sad and joyful emotions at a rate of 60%.

    DOI: 10.1016/j.specom.2020.11.004

    Web of Science

    researchmap

    その他リンク: https://arxiv.org/abs/2102.10345

  • Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference (APSIPA-ASC 2020)   826 - 830   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE/APSIPA  

    End-to-end text-to-speech (TTS) models have achieved remarkable results in recent times. However, the model requires a large amount of text and audio data for training. A speaker adaptation method based on fine-tuning has been proposed for constructing a TTS model using small scale data. Although these methods can replicate the target speaker s voice quality, synthesized speech includes the deletion and/or repetition of speech. The goal of speaker adaptation is to change the voice quality to match the target speaker ' s on the premise that adjusting the necessary modules will reduce the amount of data to be fine-tuned. In this paper, we clarify the role of each module in the Transformer-TTS process by not updating it. Specifically, we froze character embedding, encoder, layer predicting stop token, and loss function for estimating sentence ending. The experimental results showed the following: (1) fine-tuning the character embedding did not result in an improvement in the deletion and/or repetition of speech, (2) speech deletion increases if the encoder is not fine-tuned, (3) speech deletion was suppressed when the layer predicting stop token is not fine-tuned, and (4) there are frequent speech repetitions at sentence end when the loss function estimating sentence ending is omitted.

    Web of Science

    researchmap

  • Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 査読

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    Proceedings of IEEE REGION 10 CONFERENCE (TENCON 2020)   450 - 455   2020年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/tencon50793.2020.9293766

    researchmap

  • Controlling the Strength of Emotions in Speech-Like Emotional Sound Generated by WaveNet 査読 国際誌

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Proceedings of Interspeech 2020   3421 - 3425   2020年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/interspeech.2020-2064

    researchmap

    その他リンク: https://www.webofscience.com/wos/woscc/full-record/WOS:000833594103112

  • Semi-Supervised Speaker Adaptation for End-to-End Speech Synthesis with Pretrained Models 査読 国際共著 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

    Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2020)   7634 - 7638   2020年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    Recently, end-to-end text-to-speech (TTS) models have achieved a remarkable performance, however, requiring a large amount of paired text and speech data for training. On the other hand, we can easily collect unpaired dozen minutes of speech recordings for a target speaker without corresponding text data. To make use of such accessible data, the proposed method leverages the recent great success of state-of-the-art end-to-end automatic speech recognition (ASR) systems and obtains corresponding transcriptions from pretrained ASR models. Although these models could only provide text output instead of intermediate linguistic features like phonemes, end-to-end TTS can be well trained with such raw text data directly. Thus, the proposed method can greatly simplify a speaker adaptation pipeline by consistently employing end-to-end ASR/TTS ecosystems. The experimental results show that our proposed method achieved comparable performance to a paired data adaptation method in terms of subjective speaker similarity and objective cepstral distance measures.

    DOI: 10.1109/icassp40776.2020.9053371

    Web of Science

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 査読 国際誌

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2019   138 - 142   2019年11月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/APSIPAASC47483.2019.9023168

    Web of Science

    researchmap

  • Speech-like Emotional Sound Generator by WaveNet 査読 国際誌

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2019   143 - 147   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/APSIPAASC47483.2019.9023346

    Web of Science

    researchmap

  • A signal processing perspective on human gait: Decoupling walking oscillations and gestures 査読 国際誌

    Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

    Proceedings of the 4th International Conference on Interactive Collaborative Robotics 2019 (ICR 2019)   11659   75 - 85   2019年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-030-26118-4_8

    Web of Science

    researchmap

  • Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient's Speech Using Spectral Differential Modification in Voice Conversion. 査読 国際誌

    Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2018, 19th Annual Conference of the International Speech Communication Association, Hyderabad, India, 2-6 September 2018.   2464 - 2468   2018年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/Interspeech.2018-1239

    Web of Science

    researchmap

  • Sound sensing using smartphones as a crowdsourcing approach. 査読 国際誌

    Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

    2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017   1328 - 1333   2017年12月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/APSIPA.2017.8282238

    Web of Science

    researchmap

  • An investigation to transplant emotional expressions in DNN-based TTS synthesis. 査読 国際誌

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017   1253 - 1258   2017年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/APSIPA.2017.8282231

    Web of Science

    researchmap

  • New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease. 査読 国際誌

    Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

    Proceedings of the 1st ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks, LocalRec@SIGSPATIAL 2017, Redondo Beach, CA, USA, November 7-10, 2017   1:1 - 1:7   2017年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3148150.3148151

    researchmap

    その他リンク: http://doi.acm.org/10.1145/3148150.3148151

  • Prediction of subjective assessments for a noise map using deep neural networks. 査読 国際誌

    Shota Kobayashi, Masanobu Abe, Sunao Hara

    Adjunct Proceedings of the 2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2017 ACM International Symposium on Wearable Computers, UbiComp/ISWC 2017, Maui, HI, USA, September 11-15, 2017   113 - 116   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM  

    DOI: 10.1145/3123024.3123091

    Web of Science

    researchmap

    その他リンク: http://doi.acm.org/10.1145/3123024.3123091

  • Speaker Dependent Approach for Enhancing a Glossectomy Patient’s Speech via GMM-Based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2017   2017年8月

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    DOI: 10.21437/interspeech.2017-841

    Web of Science

    researchmap

  • Speaker Dependent Approach for Enhancing a Glossectomy Patient's Speech via GMM-based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    18TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2017), VOLS 1-6   3384 - 3388   2017年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA-INT SPEECH COMMUNICATION ASSOC  

    In this paper, using GMM-based voice conversion algorithm, we propose to generate speaker-dependent mapping functions to improve the intelligibility of speech uttered by patients with a wide glossectomy. The speaker-dependent approach enables to generate the mapping functions that reconstruct missing spectrum features of speech uttered by a patient without having influences of a speaker's factor. The proposed idea is simple, i.e., to collect speech uttered by a patient before and after the glossectomy, but in practice it is hard to ask patients to utter speech just for developing algorithms. To confirm the performance of the proposed approach, in this paper, in order to simulate glossectomy patients, we fabricated an intraoral appliance which covers lower dental arch and tongue surface to restrain tongue movements. In terms of the Mel-frequency cepstrum (MFC) distance, by applying the voice conversion, the distances were reduced by 25% and 42% for speaker dependent case and speaker-independent case, respectively. In terms of phoneme intelligibility, dictation tests revealed that speech reconstructed by speaker-dependent approach almost always showed better performance than the original speech uttered by simulated patients, while speaker-independent approach did not.

    DOI: 10.21437/Interspeech.2017-841

    Web of Science

    researchmap

  • Enhancing a glossectomy patient's speech via GMM-based voice conversion 査読 国際誌

    Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

    2016 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA)   1 - 4   2016年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/apsipa.2016.7820909

    Web of Science

    researchmap

  • LiBS: Lifelog browsing system to support sharing of memories 査読 国際誌

    Atsuya Namba, Sunao Hara, Masanobu Abe

    UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing   165 - 168   2016年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    We propose a lifelog browsing system through which users can share memories of their experiences with other users. Most importantly, by using global positioning system data and time stamps, the system simultaneously displays a variety of log information in a time-synchronous manner. This function empowers users with not only an easy interpretation of other users' experiences but also nonverbal notifications. Shared information on this system includes photographs taken by users, Google street views, shops and restaurants on the map, daily weather, and other items relevant to users' interests. In evaluation experiments, users preferred the proposed system to conventional photograph albums and maps for explaining and sharing their experiences. Moreover, through displayed information, the listeners found out their interest items that had not been mentioned by the speakers.

    DOI: 10.1145/2968219.2971401

    Scopus

    researchmap

    その他リンク: http://doi.acm.org/10.1145/2968219.2971401

  • Safety vs. Privacy: User preferences from the monitored and monitoring sides of a monitoring system 査読 国際誌

    Shigeki Kamada, Sunao Hara, Masanobu Abe

    UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing   101 - 104   2016年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    In this study, in order to develop a monitoring system that takes into account privacy issues, we investigated user preferences in terms of the monitoring and privacy protec-tion levels. The people on the monitoring side wanted the monitoring system to allow them to monitor in detail. Con-versely, it was observed for the people being monitored that the more detailed the monitoring, the greater the feelings of being surveilled intrusively. Evaluation experiments were performed using the location data of three people in differ-ent living areas. The results of the experiments show that it is possible to control the levels of monitoring and privacy protection without being affected by the shape of a living area by adjusting the quantization level of location informa-tion. Furthermore, it became clear that the granularity of location information satisfying the people on the monitored side and the monitoring side is different.

    DOI: 10.1145/2968219.2971412

    Scopus

    researchmap

    その他リンク: http://doi.acm.org/10.1145/2968219.2971412

  • Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation 査読 国際誌

    Sunao Hara, Shota Kobayashi, Masanobu Abe

    IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016)   1 - 6   2016年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents a sound collection system that uses crowdsourcing to gather information for visualizing area characteristics. First, we developed a sound collection system to simultaneously collect physical sounds, their statistics, and subjective evaluations. We then conducted a sound collection experiment using the developed system on 14 participants. We collected 693,582 samples of equivalent Aweighted loudness levels and their locations, and 5,935 samples of sounds and their locations. The data also include subjective evaluations by the participants. In addition, we analyzed the changes in sound properties of some areas before and after the opening of a large-scale shopping mall in a city. Next, we implemented visualizations on the server system to attract users' interests. Finally, we published the system, which can receive sounds from any Android smartphone user. The sound data were continuously collected and achieved a specified result.

    DOI: 10.1109/ICMEW.2016.7574694

    Web of Science

    researchmap

  • A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding 査読 国際誌

    Masaki Yamaoka, Sunao Hara, Masanobu Abe

    Proceedings of APSIPA Annual Summit and Conference 2015   229 - 232   2015年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    We propose a spoken dialog strategy for car navigation systems to facilitate safe driving. To drive safely, drivers need to concentrate on their driving; however, their concentration may be disrupted due to disagreement with their spoken dialog system. Therefore, we need to solve the problems of user misunderstandings as well as misunderstanding of spoken dialog systems. For this purpose, we introduced a driver workload level in spoken dialog management in order to prevent user misunderstandings. A key strategy of the dialog management is to make speech redundant if the driver's workload is too high in assuming that the user probably misunderstand the system utterance under such a condition. An experiment was conducted to compare performances of the proposed method and a conventional method using a user simulator. The simulator is developed under the assumption of two types of drivers: an experienced driver model and a novice driver model. Experimental results showed that the proposed strategies achieved better performance than the conventional one for task completion time, task completion rate, and user's positive speech rate. In particular, these performance differences are greater for novice users than for experienced users.

    DOI: 10.1109/APSIPA.2015.7415511

    Web of Science

    researchmap

  • Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization 査読 国際誌

    Masanobu Abe, Akihiko Hirayama, Sunao Hara

    Proceedings of IEEE International Conference on Consumer Electronics (IEEE-ICCE 2015)   36 - 39   2015年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents an algorithm to mine basic patterns of human activities on a daily basis using non-negative matrix factorization (NMF). The greatest benefit of the algorithm is that it can elicit patterns from which meanings can be easily interpreted. To confirm its performance, the proposed algorithm was applied to PC logging data collected from three occupations in offices. Daily patterns of software usage were extracted for each occupation. Results show that each occupation uses specific software in its own time period, and uses several types of software in parallel in its own combinations. Experiment results also show that patterns of 144 dimension vectors were compressible to those of 11 dimension vectors without degradation in occupation classification performance. Therefore, the proposed algorithm compressed basic software usage patterns to about one-tenth of their original dimensions while preserving the original information. Moreover, the extracted basic patterns showed reasonable interpretation of daily working patterns in offices.

    DOI: 10.1109/ICCE.2015.7066309

    Web of Science

    researchmap

  • Sub-Band Text-to-Speech Combining Sample-Based Spectrum with Statistically Generated Spectrum 査読 国際誌

    Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki, Hideyuki Mizuno

    Proceedings of Interspeech 2015   264 - 268   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    As described in this paper, we propose a sub-band speech synthesis approach to develop a high quality Text-to-Speech (TTS) system: a sample-based spectrum is used in the high-frequency band and spectrum generated by HMM-based TTS is used in the low-frequency band. Herein, sample-based spectrum means spectrum selected from a phoneme database such that it is the most similar to spectrum generated by HMM-based speech synthesis. A key idea is to compensate over-smoothing caused by statistical procedures by introducing a sample-based spectrum, especially in the high-frequency band. Listening test results show that the proposed method has better performance than HMM-based speech synthesis in terms of clarity. It is at the same level as HMM-based speech synthesis in terms of smoothness. In addition, preference test results among the proposed method, HMM-based speech synthesis, and waveform speech synthesis using 80 min speech data reveal that the proposed method is the most liked.

    Web of Science

    researchmap

    その他リンク: http://dblp.uni-trier.de/db/conf/interspeech/interspeech2015.html#conf/interspeech/InaiHAIMM15

  • Sound collection and visualization system enabled participatory and opportunistic sensing approaches 査読 国際誌

    Sunao Hara, Masanobu Abe, Noboru Sonehara

    Proceedings of 2015 IEEE International Conference on Pervasive Computing and Communication Workshops (PerCom Workshops)   390 - 395   2015年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper presents a sound collection system to visualize environmental sounds that are collected using a crowd sourcing approach. An analysis of physical features is generally used to analyze sound properties; however, human beings not only analyze but also emotionally connect to sounds. If we want to visualize the sounds according to the characteristics of the listener, we need to collect not only the raw sound, but also the subjective feelings associated with them. For this purpose, we developed a sound collection system using a crowdsourcing approach to collect physical sounds, their statistics, and subjective evaluations simultaneously. We then conducted a sound collection experiment using the developed system on ten participants. We collected 6,257 samples of equivalent loudness levels and their locations, and 516 samples of sounds and their locations. Subjective evaluations by the participants are also included in the data. Next, we tried to visualize the sound on a map. The loudness levels are visualized as a color map and the sounds are visualized as icons which indicate the sound type. Finally, we conducted a discrimination experiment on the sound to implement a function of automatic conversion from sounds to appropriate icons. The classifier is trained on the basis of the GMM-UBM (Gaussian Mixture Model and Universal Background Model) method. Experimental results show that the F-measure is 0.52 and the AUC is 0.79.

    DOI: 10.1109/PERCOMW.2015.7134069

    Web of Science

    researchmap

    その他リンク: https://ousar.lib.okayama-u.ac.jp/ja/53271

  • Algorithm to Estimate a Living Area Based on Connectivity of Places with Home 査読 国際誌

    Yuji Matsuo, Sunao Hara, Masanobu Abe

    HCI International 2015 - Posters’ Extended Abstracts (Part II), CCIS 529   529   570 - 576   2015年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:SPRINGER-VERLAG BERLIN  

    We propose an algorithm to estimate a person's living area using his/her collected Global Positioning System (GPS) data. The most important feature of the algorithm is the connectivity of places with a home, i.e., a living area must consist of a home, important places, and routes that connect them. This definition is logical because people usually go to a place from home, and there can be several routes to that place. Experimental results show that the proposed algorithm can estimate living area with a precision of 0.82 and recall of 0.86 compared with the grand truth established by users. It is also confirmed that the connectivity of places with a home is necessary to estimate a reasonable living area.

    DOI: 10.1007/978-3-319-21383-5_95

    Web of Science

    researchmap

  • Extraction of Key Segments from Day-Long Sound Data 査読 国際誌

    Akinori Kasai, Sunao Hara, Masanobu Abe

    HCI International 2015 - Posters’ Extended Abstracts (Part I), CCIS 528   528   620 - 626   2015年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:SPRINGER-VERLAG BERLIN  

    We propose a method to extract particular sound segments from the sound recorded during the course of a day in order to provide sound segments that can be used to facilitate memory. To extract important parts of the sound data, the proposed method utilizes human behavior based on a multisensing approach. To evaluate the performance of the proposed method, we conducted experiments using sound, acceleration, and global positioning system data collected by five participants for approximately two weeks. The experimental results are summarized as follows: (1) various sounds can be extracted by dividing a day into scenes using the acceleration data; (2) sound recorded in unusual places is preferable to sound recorded in usual places; and (3) speech is preferable to nonspeech sound.

    DOI: 10.1007/978-3-319-21380-4_105

    Web of Science

    researchmap

  • Inhibitory Effects of an Orally Active Small Molecule Alpha4beta1/Alpha4beta7 Integrin Antagonist, TRK-170, on Spontaneous Colitis in HLA-B27 Transgenic Rats

    Hiroe Hirokawa, Yoko Koga, Rie Sasaki, Sunao Hara, Hiroyuki Meguro, Mie Kainoh

    GASTROENTEROLOGY   146 ( 5 )   S640 - S640   2014年5月

     詳細を見る

    記述言語:英語   出版者・発行元:W B SAUNDERS CO-ELSEVIER INC  

    Web of Science

    researchmap

  • A graph-based spoken dialog strategy utilizing multiple understanding hypotheses 査読

    Norihide Kitaoka, Yuji Kinoshita, Sunao Hara, Chiyomi Miyajima, Kazuya Takeda

    Information and Media Technologies   9 ( 1 )   111 - 120   2014年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Information and Media Technologies Editorial Board  

    We regarded a dialog strategy for information retrieval as a graph search problem and proposed several novel dialog strategies that can recover from misrecognition through a spoken dialog that traverses the graph. To recover from misrecognition without seeking confirmation, our system kept multiple understanding hypotheses at each turn and searched for a globally optimal hypothesis in the graph whose nodes express understanding states across user utterances in a whole dialog. In the search, we used a new criterion based on efficiency in information retrieval and consistency with understanding hypotheses, which is also used to select an appropriate system response. We showed that our system can make more efficient and natural dialogs than previous ones.

    DOI: 10.11185/imt.9.111

    CiNii Article

    researchmap

  • New approach to emotional information exchange: Experience metaphor based on life logs 査読 国際誌

    Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

    2014 IEEE International Conference on Pervasive Computing and Communication Workshops, PerCom 2014 Workshops   191 - 194   2014年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    We are striving to develop a new communication technology based on individual experiences that can be extracted from life logs. We have proposed the "Emotion Communication Model" and confirmed that significant correlation exists between experience and emotion. As the second step, particularly addressing impressive places and events, this paper describes an investigation of the extent to which we can share emotional information with others through individuals' experiences. Subjective experiments were conducted using life log data collected during 7-47 months. Experiment results show that (1) impressive places are determined by the distance from home, visit frequency, and direction from home and that (2) positive emotional information is highly consistent among people (71.4%), but it is not true for negative emotional information. Therefore, experiences are useful as metaphors to express positive emotional information.

    DOI: 10.1109/PerComW.2014.6815198

    researchmap

  • Development of a Toolkit Handling Multiple Speech-Oriented Guidance Agents for Mobile Applications 査読 国際誌

    Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

    Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice   79 - 85   2014年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:Springer  

    DOI: 10.1007/978-1-4614-8280-2_8

    researchmap

  • Evaluation of Invalid Input Discrimination Using Bag-of-Words for Speech-Oriented Guidance System 査読 国際誌

    Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

    Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice   389 - 397   2014年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:Springer  

    DOI: 10.1007/978-1-4614-8280-2_35

    researchmap

  • A Hybrid Text-to-Speech Based on Sub-Band Approach 査読 国際誌

    Takuma Inoue, Sunao Hara, Masanobu Abe

    Proceedings of Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference   1 - 4   2014年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper proposes a sub-band speech synthesis approach to develop high-quality Text-to-Speech (TTS). For the low-frequency band and high-frequency band, Hidden Markov Model (HMM)-based speech synthesis and waveform -based speech synthesis are used, respectively. Both speech synthesis methods are widely known to show good performance and to have benefits and shortcomings from different points of view. One motivation is to apply the right speech synthesis method in the right frequency band. Experiment results show that in terms of the smoothness the proposed approach shows better performance than waveform -based speech synthesis, and in terms of the clarity it shows better than HMM-based speech synthesis. Consequently, the proposed approach combines the inherent benefits from both waveform-based speech synthesis and HMM-based speech synthesis.

    DOI: 10.1109/APSIPA.2014.7041575

    Web of Science

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却 査読

    真嶋温佳, 藤田洋子, トーレス・ラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    情報処理学会論文誌   54 ( 2 )   443 - 451   2013年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    実環境における音声認識を用いた情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する.これらの入力はシステムの誤作動・誤認識の原因となるので,システムへの入力として適切な入力(有効入力)と不適切な入力(無効入力)の識別を行い,無効入力を棄却することにより,無効入力に対する応答処理を行わないことが重要である.従来,有効入力と無効入力との識別には,メル周波数ケプストラム係数などの音響的特徴量によるGMM(Gaussian Mixture Model)が用いられる.しかし,入力データの音声認識結果から得られる言語的な情報を使うことにより,システムのタスクを考えたうえで有効入力と無効入力の識別が可能になると考えられる.そこで本論文では,音響特徴量にBag-of-Words(BOW)を言語的特徴量として併用した無効入力の識別を検討した.識別手法としては,サポートベクタマシン(SVM)および最大エントロピー法を用いた.実験には実環境音声情報案内システム「たけまるくん」の入力データを用いた.SVMによる識別結果では,GMMによる音響尤度のみを用いた場合に比べて,BOWを用いた場合,F尺度を82.19%から85.41%に改善することができた.さらに,GMMによる音響尤度,発話時間,SNRを組み合わせた特徴量にBOWを追加することで,F尺度を86.58%まで改善することができた.詳細な分析の結果,BOWは特に無効入力の誤受理を減らす効果があることが示された.On a real environment speech-oriented information guidance system, a valid and invalid input discrimination is important as invalid inputs such as noise, laugh, cough and utterances between users lead to unpredictable system responses. Generally, acoustic features such as MFCC (Mel-Frequency Cepstral Coefficient) are used for discrimination. Comparing acoustic likelihoods of GMMs (Gaussian Mixture Models) from speech data and noise data is one of the typical methods. In addition to that, using linguistic features, such as speech recognition result, is considered to improve discrimination accuracy as it reflects the task-domain of invalid inputs and meaningless recognition results from noise inputs. In this paper, we introduce Bag-of-Words (BOW) as a feature to discriminate between valid and invalid inputs. Support Vector Machine (SVM) and Maximum Entropy method (ME) are also employed to realize robust classification. We experimented the methods using real environment data obtained from the guidance system "Takemaru-kun." By applying BOW on SVM, the F-measure is improved to 85.09%, from 82.19% when using GMMs. In addition, experiments using features combining BOW with acoustic likelihoods from GMMs, Duration and SNR were conducted, improving the F-measure to 86.58%.

    CiNii Article

    CiNii Books

    researchmap

  • 音声対話システムの発話・動作タグN-gramを用いた課題未達成のオンライン検出 査読

    原直, 北岡教英, 武田一哉

    電子情報通信学会論文誌 (D)   J96-D ( 1 )   81 - 93   2013年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本論文ではN-gram特徴を用いた音声対話システム利用時の課題未達成対話の検出手法を提案する.実験にはユーザが自分のPC上で利用するという,実環境下で収録された楽曲検索のための音声対話システムとの対話データを利用する.楽曲検索課題を行っている全ての対話データはユーザとシステムの発話を抽象化した発話・動作ダグにより記述し,そのタグ系列をN-gramとしてモデル化を行う.本研究では,タグ系列中のタグN-gramの出現回数を素性として,Support Vector MachineやC4.5決定木などの識別的手法による課題未達成対話の検出実験を行った.更に対話長や反応時間などの対話の特徴を表す対話変数を導入することで検出性能の向上を行った.その結果,ユーザの4回目の発話までを用いることで,約76%の識別率となった.

    CiNii Article

    CiNii Books

    researchmap

    その他リンク: http://search.ieice.org/bin/summary.php?id=j96-d_1_81&category=D&year=2013&lang=J&abst=

  • Acoustic Model Training Using Pseudo-Speaker Features Generated by MLLR Transformations for Robust Speaker-Independent Speech Recognition 査読

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    IEICE TRANSACTIONS on Information and Systems   E95D ( 10 )   2479 - 2485   2012年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG  

    A novel speech feature generation-based acoustic model training method for robust speaker-independent speech recognition is proposed. For decades, speaker adaptation methods have been widely used. All of these adaptation methods need adaptation data. However, our proposed method aims to create speaker-independent acoustic models that cover not only known but also unknown speakers. We achieve this by adopting inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then we train our models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the transformation matrices for the existing speakers are estimated. Next, we construct pseudo-speaker transformations by sampling the weight parameters from the distribution, and apply the transformation to the normalized features of the existing speaker to generate the features of the pseudo-speakers. Finally, using these features, we train the acoustic models. Evaluation results show that the acoustic models trained using our proposed method are robust for unknown speakers.

    DOI: 10.1587/transinf.E95.D.2479

    Web of Science

    researchmap

    その他リンク: http://search.ieice.org/bin/summary.php?id=e95-d_10_2479

  • Causal analysis of task completion errors in spoken music retrieval interactions 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of the 8th international conference on Language Resources and Evaluation (LREC 2012)   1365 - 1372   2012年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, we analyze the causes of task completion errors in spoken dialog systems, using a decision tree with N-gram features of the dialog to detect task-incomplete dialogs. The dialog for a music retrieval task is described by a sequence of tags related to user and system utterances and behaviors. The dialogs are manually classified into two classes: completed and uncompleted music retrieval tasks. Differences in tag classification performance between the two classes are discussed. We then construct decision trees which can detect if a dialog finished with the task completed or not, using information gain criterion. Decision trees using N-grams of manual tags and automatic tags achieved 74.2% and 80.4% classification accuracy, respectively, while the tree using interaction parameters achieved an accuracy rate of 65.7%. We also discuss more details of the causality of task incompletion for spoken dialog systems using such trees.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1059.html

  • Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation 査読 国際誌

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of 2011 Automatic Speech Recognition and Understanding Workshop (ASRU 2011)   169 - 172   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    In this paper, we propose a novel acoustic model training method which is suitable for speaker adaptation in speech recognition. Our method is based on feature generation from a small amount of speakers' data. For decades, speaker adaptation methods have been widely used. Such adaptation methods need some amount of adaptation data and if the data is not sufficient, speech recognition performance degrade significantly. If the seed models to be adapted to a specific speaker can widely cover more speakers, speaker adaptation can perform robustly. To make such robust seed models, we adopt inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then train our seed models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the MLLR transformation matrices for the existing speakers is estimated. Next we generate pseudo-speaker MLLR transformations by sampling the weight parameters from the distribution, and apply the inverse of the transformation to the normalized existing speaker features to generate the pseudo-speakers' features. Finally, using these features, we train the acoustic seed models. Using this seed models, we obtained better speaker adaptation results than using simply environmentally adapted models. © 2011 IEEE.

    DOI: 10.1109/ASRU.2011.6163925

    Scopus

    researchmap

  • Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations 査読 国際誌

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of 2011 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2011)   1 - 5   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:APSIPA  

    In this paper a novel speech feature generationbased acoustic model training method is proposed. For decades, speaker adaptation methods have been widely used. All existing adaptation methods need adaptation data. However, our proposed method creates speaker-independent acoustic models that cover not only known but also unknown speakers. We do this by adopting inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then train our models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the MLLR transformation matrices for the existing speakers are estimated. Next we generate pseudo-speaker MLLR transformations by sampling the weight parameters from the distribution, and apply the inverse of the transformation to the normalized existing speaker features to generate the pseudospeakers' features. Finally, using these features, we train the acoustic models. Evaluation results show that the acoustic models which are created are robust for unknown speakers.

    Scopus

    researchmap

  • On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of the Paralinguistic Information and Its Integration in Spoken Dialogue Systems Workshop   215 - 225   2011年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of INTERSPEECH 2011   1312 - 1315   2011年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA-INT SPEECH COMMUNICATION ASSOC  

    We propose a method of detecting "task incomplete" dialogs in spoken dialog systems using N-gram-based dialog models. We used a database created during a field test in which inexperienced users used a client-server music retrieval system with a spoken dialog interface on their own PCs. In this study, the dialog for a music retrieval task consisted of a sequence of user and system tags that related their utterances and behaviors. The dialogs were manually classified into two classes: the dialog either completed the music retrieval task or it didn't. We then detected dialogs that did not complete the task, using N-gram probability models or a Support Vector Machine with N-gram feature vectors trained using manually classified dialogs. Off-line and on-line detection experiments were conducted on a large amount of real data, and the results show that our proposed method achieved good classification performance.

    Web of Science

    researchmap

    その他リンク: http://www.isca-speech.org/archive/interspeech_2011/i11_1305.html

  • Music Recommendation System Based on Human-to-human Conversation Recognition 査読 国際誌

    Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Workshop Proceedings of the 7th International Conference on Intelligent Environments: Ambient Intelligence and Smart Environments   10   352 - 361   2011年

     詳細を見る

    記述言語:英語   掲載種別:論文集(書籍)内論文   出版者・発行元:IOS PRESS  

    We developed an ambient system that plays music suitable for the mood of a human-human conversation using words obtained from a continuous-speech recognition system. Using the correspondence between a document space based on the texts related to the music and an acoustic space that expresses various audio features, the continuous-speech recognition results are mapped to an acoustic space. We performed a subjective evaluation of the system. The subjects rated the recommended music and the result reveals that the 10 most highly recommended selections included suitable music.

    DOI: 10.3233/978-1-60750-795-6-352

    Web of Science

    researchmap

  • Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of INTERSPEECH2010   3034 - 3037   2010年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ISCA  

    In this paper, we propose a method of detecting task-incompleted users for a spoken dialog system using an N-gram-based dialog history model. We collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database was made by a field test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model was trained from sequences that consist of user dialog acts and/or system dialog acts for two dialog classes, that is, the dialog completed the music retrieval task or the dialog incompleted the task. Then the system detects unknown dialogs that is not completed the task based on the N-gram likelihood. Experiments were conducted on large real data, and the results show that our proposed method achieved good classification performance. When the classifier correctly detected all of the task-incompleted dialogs, our proposed method achieved a false detection rate of 6%.

    Web of Science

    researchmap

    その他リンク: http://www.isca-speech.org/archive/interspeech_2010/i10_3034.html

  • Rapid acoustic model adaptation using inverse MLLR-based feature generation 査読 国際誌

    Arata Ito, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    Proceedings of ICA2010   5   1 - 6   2010年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Scopus

    researchmap

  • Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system 査読 国際誌

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    LREC 2010 - SEVENTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION   78 - 83   2010年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, we propose an estimation method of user satisfaction for a spoken dialog system using an N-gram-based dialog history model. We have collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database is made by a field-test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model is trained from the sequences that consist of users' dialog acts and/or the system's dialog acts for each one of six user satisfaction levels: from 1 to 5 and phi (task not completed). Then, the satisfaction level is estimated based on the N-gram likelihood. Experiments were conducted on the large real data and the results show that our proposed method achieved good classification performance; the classification accuracy was 94.7% in the experiment on a classification into dialogs with task completion and those without task completion. Even if the classifier detected all of the task incomplete dialog correctly, our proposed method achieved the false detection rate of only 6%.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2010/summaries/579.html

  • Data collection and usability study of a PC-based speech application in various user environments 査読 国際誌

    Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Norihide Kitaoka, Kazuya Takeda

    Proceedings of Oriental-COCOSDA 2008   39 - 44   2008年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • In-car Speech Data Collection along with Various Multimodal Signals 査読 国際誌

    Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

    Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08)   1846 - 1851   2008年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA  

    In this paper, a large-scale real-world speech database is introduced along with other multimedia driving data. We designed a data collection vehicle equipped with various sensors to synchronously record twelve-channel speech, three-channel video, driving behavior including gas and brake pedal pressures, steering angles, and vehicle velocities, physiological signals including driver heart rate, skin conductance, and emotion-based sweating on the palms and soles, etc. These multimodal data are collected while driving on city streets and expressways under four different driving task conditions including two kinds of monologues, human-human dialog, and human-machine dialog. We investigated the response timing of drivers against navigator utterances and found that most overlapped with the preceding utterance due to the task characteristics and the features of Japanese. When comparing utterance length, speaking rate, and the filler rate of driver utterances in human-human and human-machine dialogs, we found that drivers tended to use longer and faster utterances with more fillers to talk with humans than machines.

    Web of Science

    researchmap

    その他リンク: http://www.lrec-conf.org/proceedings/lrec2008/summaries/472.html

  • 多様な音響環境下における音声認識システム利用時のデータ収集システム 査読

    原直, 宮島千代美, 伊藤克亘, 武田一哉

    電子情報通信学会論文誌(D)   J90-D ( 10 )   2807 - 2816   2007年10月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:一般社団法人電子情報通信学会  

    多様なPC利用環境において音声認識の被験者実験を行うために,WWWを利用した音声対話システム及びそのデータ収集システムを構築した.本システムのユーザはPC上にインストールされたクライアントプログラムを用いることで音声対話によりPC内に蓄積された音楽を再生したり,音楽ダウンロードサイトの楽曲を試聴することができる.クライアントプログラムの利用により収集された音声データや対話ログはインターネットを介してサーバ上に蓄積される.サーバには,ユーザごとの辞書のカスタマイズ等の機能も実装している.本システムをインターネット上で試験的に公開し,2か月間のフィールドテストとしてデータ収集を行ったところ合計59時間のシステム稼動時データを収集した.そのうち約5時間41分のデータ(11351個)が音声区間として検出されており,システムに対して発話されていた音声データとして6335発話を得た.

    CiNii Article

    CiNii Books

    researchmap

  • An online customizable music retrieval system with a spoken dialogue interface 査読 国際誌

    Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

    The Journal of the Acoustical Society of America   120 ( 5-2 )   3378 - 3379   2006年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    CiNii Article

    researchmap

  • Novel orally active alpha 4 integrin antagonist, T-728, attenuates dextran sodium sulfate-induced chronic colitis in mice

    Ken-Ichi Hayashi, Hiroyuki Meguro, Sunao Hara, Rie Sasaki, Yoko Koga, Meiko Takeshita, Naoyoshi Yamamoto, Hiroe Hirokawa, Mie Kainoh

    GASTROENTEROLOGY   130 ( 4 )   A352 - A352   2006年4月

     詳細を見る

    記述言語:英語   出版者・発行元:W B SAUNDERS CO-ELSEVIER INC  

    0

    Web of Science

    researchmap

  • Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System 査読 国際誌

    Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Proceedings of Oriental-COCOSDA 2005   164 - 168   2005年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

▼全件表示

MISC

  • 機械学習による環境音からの主観的な騒音マップ生成 招待

    原直, 阿部匡伸

    騒音制御   46 ( 3 )   126 - 130   2022年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    researchmap

  • クラウドセンシングによる環境音の収集 招待

    阿部匡伸, 原直

    騒音制御   42 ( 1 )   20 - 23   2018年

     詳細を見る

    記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)  

    researchmap

  • スマートデバイスによる音収録とその応用 招待

    原直

    日本音響学会誌   73 ( 8 )   483 - 490   2017年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)   出版者・発行元:日本音響学会  

    DOI: 10.20697/jasj.73.8_483

    CiNii Article

    CiNii Books

    researchmap

  • イベントを比喩に用いた感情伝達法の検討 査読

    濱野和人, 原直, 阿部匡伸

    電子情報通信学会論文誌   J97-D ( .12 )   1680 - 1683   2014年12月

     詳細を見る

    記述言語:日本語   掲載種別:速報,短報,研究ノート等(学術雑誌)   出版者・発行元:電子情報通信学会  

    researchmap

  • ライフログ研究から見た音響信号の活用 招待

    原直, 阿部 匡伸

    騒音制御   38 ( 1 )   15 - 21   2014年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)   出版者・発行元:日本騒音制御工学会  

    CiNii Article

    CiNii Books

    researchmap

  • 「音声対話システムの実用化に向けて」10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術 招待

    西村竜一, 原直, 川波弘道, LEE Akinobu, 鹿野清宏

    人工知能学会誌   28 ( 1 )   52 - 59   2013年1月

     詳細を見る

    記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)   出版者・発行元:一般社団法人 人工知能学会  

    DOI: 10.11517/jjsai.28.1_52

    CiNii Article

    CiNii Books

    J-GLOBAL

    researchmap

  • 音声対話システムの発話系列N-gramを利用した課題未達成対話の検出 査読

    原 直, 北岡 教英, 武田 一哉

    電子情報通信学会論文誌. D, 情報・システム   J94-D ( 2 )   497 - 500   2011年2月

     詳細を見る

    記述言語:日本語   掲載種別:速報,短報,研究ノート等(学術雑誌)   出版者・発行元:電子情報通信学会情報・システムソサイエティ  

    音声対話システムの利用によって課題を達成できなかった対話の検出を行う.ユーザとシステムの発話を抽象化した発話・動作系列をN-gramによりモデル化し,課題未達成対話を検出する実験を行ったところ,良好な結果が得られたので報告する.

    CiNii Article

    CiNii Books

    researchmap

  • 撥弦楽器特有のアーティキュレーションを考慮したDNNによる楽器音合成の検討

    廣畑 和音, 阿部 匡伸, 原 直

    情報処理学会技術研究報告(音楽情報科学MUS)   2024-MUS-140 ( 56 )   1 - 6   2024年6月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • GPSデータを用いた個人認証における生活圏の有効性の検討

    遠山大督, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   123 ( 364 )   57 - 62   2024年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 音声対話システムのテキスト音声合成における声質変換とx-vector埋め込みを用いた感情制御方式の検討

    小原俊一, 阿部匡伸, 原直

    日本音響学会講演論文集   1275 - 1278   2023年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人日本音響学会  

    researchmap

  • ウェアラブルデバイスを用いた曖昧な入力からの会話支援システムの検討

    岩崎茉理, 原直, 阿部匡伸

    日本音響学会講演論文集   1369 - 1372   2023年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人日本音響学会  

    researchmap

  • 音声対話システムのための入力音声の感情に同調する声質変換とx-vector埋め込みを用いたテキストからの音声合成方式の検討

    小原俊一, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   122 ( 389 )   203 - 208   2023年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 小説オーディオブックの強調部分を学習に用いる抑揚制御可能な End-to-End 音声合成方式の検討

    和田拓海, 阿部匡伸, 原直

    日本音響学会講演論文集   903 - 906   2023年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人日本音響学会  

    researchmap

  • ライフログに基づく共感的対話システムにおけるユーザの感情極性に応じた応答生成方式の検討

    前薗そよぎ, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   122 ( 423 )   102 - 107   2023年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • GPSデータに基づく粒度変更可能な生活圏を用いた個人認証のための類似度計算方式の検討

    遠山大督, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   122 ( 338 )   25 - 30   2023年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 差分メルケプストラムを用いた声質変換による喉締め歌唱音声改善方式の検討

    植田遥人, 阿部匡伸, 原直

    日本音響学会講演論文集   1405 - 1408   2022年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人日本音響学会  

    researchmap

  • ライフログに応じて発話を変えることでユーザに親密さを感じさせる対話システムの検討

    前薗そよぎ, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2022)講演論文集   1182 - 1190   2022年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 話者特徴量の操作によりシームレスに話者性を制御できるEnd-to-End音声合成方式の検討

    青谷直樹, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   122 ( 81 )   55 - 60   2022年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • SSQPによる場所の印象情報を環境音と航空写真から推定する方式の検討

    小野祐介, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   121 ( 401 )   51 - 56   2022年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 口唇特徴量を利用した知識蒸留による舌亜全摘出者の音韻明瞭度改善法の検討

    高島和嗣, 阿部匡伸, 原直

    電子情報通信学会技術研究報告   121 ( 385 )   108 - 113   2022年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • バックコーラス歌唱合成のためのDNNを用いた自然性の高い歌声合成方式の検討

    木岡智宏, 阿部匡伸, 原直

    電子情報通信学会技術研究報告   121 ( 385 )   102 - 107   2022年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • インソール型圧力センサを用いたパーキンソン病重症度推定

    林倖生, 原直, 阿部匡伸, 武本麻美

    電子情報通信学会総合大会(H-4-7)   2022年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 音声と映像から議論への関与姿勢を推定するための特徴量の検討

    金岡翼, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   121 ( 401 )   57 - 62   2022年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 環境音と航空写真を用いた場所の印象を推定する方式の検討

    小野祐介, 原直, 阿部匡伸

    第24回 日本音響学会関西支部 若手研究者交流研究発表会 発表概要集   34 - 34   2021年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:日本音響学会関西支部  

    researchmap

  • 呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

    長塚 弘亮, 川上 滋央, 古寺 寛志, 佐藤 匡晃, 田中 祐貴, 兒玉 直紀, 原 直, 皆木 省吾

    顎顔面補綴   44 ( 2 )   76 - 76   2021年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:(一社)日本顎顔面補綴学会  

    researchmap

  • 歌声合成のための双方向LSTM によるビブラート表現方式の検討

    金子隼人, 阿部匡伸, 原直

    日本音響学会講演論文集   1109 - 1112   2021年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 音素情報を知識蒸留する舌亜全摘出者の音韻明瞭度改善法

    高島和嗣, 阿部匡伸, 原直

    日本音響学会講演論文集   1057 - 1060   2021年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • パーキンソン病重症度推定に向けたインソール型圧力センサで計測した歩行データの分析

    林倖生, 原直, 阿部匡伸, 武本麻美

    第20回情報科学技術フォーラム (FIT 2021),CK-001   3   71 - 74   2021年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

    長塚弘亮, 川上滋央, 古寺寛志, 佐藤匡晃, 田中祐貴, 兒玉直紀, 原直, 皆木省吾

    日本顎顔面補綴学会 第38回総会・学術大会   30 - 30   2021年6月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:日本顎顔面補綴学会  

    researchmap

  • 人対人の会話で自然な話題展開を支援するための対話戦略の検討

    前薗そよぎ, 原直, 阿部匡伸

    情報処理学会研究報告   2021-SLP-137 ( 16 )   1 - 6   2021年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • ニューラル機械翻訳により推定された読み仮名・韻律記号を入力とする日本語 End-to-End 音声合成の評価

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会講演論文集   847 - 850   2021年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • Evaluation of Concept Drift Adaptation for Acoustic Scene Classifier Based on Kernel Density Drift Detection and Combine Merge Gaussian Mixture Model

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    日本音響学会講演論文集   201 - 204   2021年3月

     詳細を見る

    記述言語:英語   出版者・発行元:日本音響学会  

    researchmap

  • 歌唱表現を付与できるBidirectional-LSTM を用いた歌声合成方式の検

    金子隼人, 原直, 阿部匡伸

    日本音響学会講演論文集   987 - 990   2021年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • TTSによる会話支援システムのための感圧センサを用いた手袋型入力デバイスの開発と入力速度の評価

    小林誠, 原直, 阿部匡伸

    情報処理学会研究報告   2020-HCI-190 ( 20 )   1 - 6   2020年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • パーキンソン病重症度推定のためのインソール型圧力センサを用いた時間的特徴量の検討

    林倖生, 原直, 阿部匡伸, 武本麻美

    2020年度(第71回)電気・情報関連学会中国支部連合大会,R20-14-02-03   1 - 1   2020年10月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:電気・情報関連学会中国支部  

    researchmap

  • Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会講演論文集   829 - 832   2020年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • WaveNetを用いた言語情報なし感情音声合成における感情の強さ制御の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会講演論文集   867 - 870   2020年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 映像と音声を用いた議論への関与姿勢や肯定的・否定的態度の推定方式の検討

    金岡翼, 上原佑太郎, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)講演論文集   1422 - 1429   2020年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 話題の対象に対する親密度に応じて応答する音声対話システムの検討

    加藤大地, 原直, 阿部匡伸

    情報処理学会研究報告   2020-SLP-132 ( 21 )   1 - 6   2020年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • GPSデータのクラスタリングによる日常生活における場所の重要度の分析

    平田瑠, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)講演論文集   785 - 793   2020年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • ウェアラブルデバイスによる曖昧な入力からのニューラル機械翻訳を用いた日本語文章推定方式

    渡邊淳, 原直, 阿部匡伸

    情報処理学会研究報告   2020-HCI-187 ( 7 )   1 - 7   2020年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための推定音素事後確率を用いた声質変換の検討

    荻野聖也, 原直, 阿部匡伸

    電子情報通信学会総合大会 情報・システムソサイエティ特別企画 学生ポスターセッション予稿集   124 - 124   2020年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • End-to-End 音声認識を用いた音声合成の半教師あり話者適応 国際共著

    井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

    日本音響学会講演論文集   1095 - 1098   2020年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 言語情報なし感情合成音を学習に用いたCycleGANによる感情変換方式の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会講演論文集   1165 - 1168   2020年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • End-to-End 音声認識を用いた End-to-End 音声合成の性能評価

    井上勝喜, 原直, 阿部匡伸, 渡部晋治

    第22回 日本音響学会 関西支部若手研究者交流研究発表会 概要集   6 - 6   2019年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:日本音響学会関西支部  

    researchmap

  • WaveNet による言語情報を含まない感情音声合成方式における話者性の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会講演論文集   993 - 996   2019年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 新たにデザインされた人工舌と解剖学的人工舌の効果ならびにその選択基準

    佐藤匡晃, 長塚弘亮, 川上滋央, 兒玉直紀, 原直, 阿部匡伸, 皆木省吾

    日本補綴歯科学会 中国・四国支部学術大会,抄録集   28 - 28   2019年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:日本補綴歯科学会  

    researchmap

  • CNN Autoencoderから抽出したボトルネック特徴量を用いた環境音分類

    松原拓未, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)講演論文集   339 - 346   2019年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • GPSデータに基づく日常生活における特別な行動の検出

    小林誠, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)講演論文集   846 - 853   2019年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • WaveNetによる言語情報を含まない感情音声合成方式の検討

    松本剣斗, 原直, 阿部匡伸

    情報処理学会研究報告   2019-SLP-127 ( 61 )   1 - 6   2019年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • i-vectorに基づく賑わい音の推定方式の検討

    呉セン陽, 朝田興平, 原直, 阿部匡伸

    情報処理学会研究報告   2019-SLP-127 ( 33 )   1 - 6   2019年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

    井上勝喜, 原直, 阿部匡伸, 井島勇祐

    日本音響学会講演論文集   1085 - 1088   2019年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための音素補助情報の推定方式の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    日本音響学会講演論文集   1155 - 1158   2019年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための Bidirectional LSTM-RNN に基づく音素補助情報を用いた声質変換方式の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会講演論文集   1151 - 1154   2019年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • ながら聴き用楽曲の作業負荷に及ぼす影響とその選択方式の検討

    高瀬郁, 阿部匡伸, 原直

    情報処理学会研究報告   2018-MUS-121 ( 19 )   1 - 6   2018年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • DNN音声合成における感情付与方式の評価

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会講演論文集   1105 - 1108   2018年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • Speech Enhancement of Glossectomy Patient's Speech using Voice Conversion Approach

    Masanobu Abe, Seiya Ogino, Hiroki Murakami, Sunao Hara

    日本生物物理学会第56回年会,シンポジウム:ヘルスシステムの理解と応用   198 - 198   2018年9月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:日本生物物理学会  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための補助情報の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会講演論文集   1175 - 1178   2018年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • クラウドソーシングによる環境音マップ構築のための主観的な騒々しさ推定方式の検討

    原直, 阿部匡伸

    第17回情報科学技術フォーラム (FIT 2018),O-001   4   343 - 346   2018年9月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 音声と口唇形状を用いた声質変換による舌亜全摘出者の音韻明瞭度改善の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   118 ( 112 )   7 - 12   2018年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

    村上博紀, 荻野聖也, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会講演論文集   355 - 358   2018年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • DNN音声合成における感情付与のための継続時間長モデルの検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会講演論文集   279 - 282   2018年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • クラウドソーシングによる賑わい音識別方式のフィールド実験評価

    朝田興平, 原直, 阿部匡伸

    日本音響学会講演論文集   79 - 82   2018年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • DNN音声合成における話者と感情の情報を扱うためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会講演論文集   263 - 266   2017年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • DNNに基づく差分スペクトル補正を用いた声質変換による舌亜全摘出者の音韻明瞭性改善の検討

    村上博紀, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会講演論文集   297 - 300   2017年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • DNNによる人間の感覚を考慮した騒々しさ推定方式に基づく騒音マップの作成

    小林将大, 原直, 阿部匡伸

    日本音響学会講演論文集   623 - 626   2017年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 環境音収集に効果的なインセンティブを与える可視化方式の検討 査読

    畠山晏彩子, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2017)講演論文集   255 - 262   2017年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • DNN音声合成における感情付与のためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    電子情報通信学会技術研究報告   117 ( 106 )   23 - 28   2017年6月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • 2つの粒度の生活圏に基づく見守りシステム

    鎌田成紀, 原直, 阿部匡伸

    電子情報通信学会総合大会 (D-9-12)   1 - 1   2017年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:一般社団法人電子情報通信学会  

    researchmap

  • DNNによる人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

    小林将大, 原直, 阿部匡伸

    日本音響学会講演論文集   799 - 802   2017年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会講演論文集   139 - 142   2017年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 基本周波数変形を考慮したスペクトル変換手法の検討 査読

    床建吾, 阿部匡伸, 原直

    第18回IEEE広島支部学生シンポジウム(HISS 18th)   174 - 176   2016年11月

     詳細を見る

    記述言語:日本語   出版者・発行元:IEEE広島支部  

    researchmap

  • RNNによる実環境データからのマルチ音響イベント検出

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会講演論文集   43 - 44   2016年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • スマートフォンで収録した環境音に含まれるタップ音除去方式の検討

    朝田興平, 原直, 阿部匡伸

    日本音響学会講演論文集   45 - 48   2016年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討

    原直, 田中智康, 阿部匡伸

    日本音響学会講演論文集   3 - 6   2016年9月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • GMMに基づく声質変換を用いた舌亜全摘出者の音韻明瞭性改善の検討

    田中慧, 原直, 阿部匡伸, 皆木省吾

    日本音響学会講演論文集   141 - 144   2016年9月

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    researchmap

  • 主観的評価に基づいた騒音マップ構築のためのクラウドソーシングによる環境音収集システム

    原直, 小林将大, 阿部匡伸

    電子情報通信学会技術研究報告   116 ( 189 )   41 - 46   2016年8月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    CiNii Books

    researchmap

  • 人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式 査読

    小林将大, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)講演論文集   141 - 148   2016年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • GPSデータ匿名化レベルの主観的許容度を客観的に表現する指標の検討 査読

    三藤優介, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)講演論文集   798 - 805   2016年7月

     詳細を見る

    担当区分:責任著者   記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    researchmap

  • 滞在地ネットワークに基づく滞在地間の移動傾向を表現する尺度の検討

    大藤高史, 原直, 阿部匡伸

    電子情報通信学会技術研究報告   116 ( 23 )   95 - 100   2016年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    researchmap

  • 生活圏を応用したプライバシーに配慮可能な見守り方式の検討 (情報通信マネジメント)

    鎌田 成紀, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 409 )   19 - 24   2016年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Article

    researchmap

  • A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model 査読

    Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

    The Journal of the Acoustical Society of America   140 ( 4 )   3110 - 3110   2016年

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(国際会議)  

    DOI: 10.1121/1.4969721

    researchmap

  • 振り返り支援における効率的な映像要約のための自動収集ライフログ活用法 (ライフインテリジェンスとオフィス情報システム)

    大西 杏菜, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   115 ( 27 )   23 - 28   2015年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:電子情報通信学会  

    CiNii Article

    researchmap

  • 振り返り支援における効率的な映像要約のための自動収集ライフログ活用法

    大西 杏菜, 原 直, 阿部 匡伸

    情報処理学会研究報告. GN, [グループウェアとネットワークサービス]   2015 ( 4 )   1 - 6   2015年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    ライフログを活用する場面の一つとして,自らの過去の振り返りが挙げられる.本報告では,映像を用いた振り返り支援方式に着目し,長時間の映像を効率よく要約するための自動収集ライフログ活用法について検討した.イベントでのライフログデータ (GPS・脈拍・音声) を収集し,それらのデータからライフログの要約に重要と考えられる点を抽出した.その後,抽出された点の時刻を基準にしてイベント中に同時収録された体験映像から映像の一部を切り出し,被験者に対して提示することで評価実験を行った.実験の結果,要約映像を用いた振り返りでは従来方法による振り返りよりも,ユーザにかかる負担が低いこと,多数の出来事を想起できることが示された.

    CiNii Article

    CiNii Books

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式 (ライフインテリジェンスとオフィス情報システム)

    林 啓吾, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 500 )   89 - 94   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    近年,自分の行動を記録したライフログが注目されている.ライフログを用いて振り返りを行うためには振り返りに必要なデータを検索する必要がある.本報告では,GPSデータから抽出される滞在地の特徴量を用いていつもと違う「特別な日」を検索する方式を検討した.提案方式の有用性を検証するための評価実験システムを作成し,7名の被験者を対象とする評価実験を行った.特別な日の検索精度を検証したところ,特別な日を60%,非日常を90%の精度で検索できることが分かった.主観的な評価として従来手法と提案方式を利用した振り返りの有効性,効率,満足度を比較した.従来手法より少し効率は劣るものの,有効性と満足度は高く,多くのことを詳細に振り返ることができることがわかった.

    CiNii Article

    CiNii Books

    researchmap

  • 滞在地と経路に着目した生活圏抽出法 (ライフインテリジェンスとオフィス情報システム)

    松尾 雄二, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 500 )   77 - 82   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    高齢化社会における認知症高齢者の徘徊行動や児童の犯罪被害増加などが社会問題となり,世間の見守りに対する関心は高まっている.そこで本報告では,GPSデータのログを滞在地と経路に分類し,見守りシステムに応用するための生活圏抽出法を検討した.滞在地の抽出は滞在地と移動経路との頻度の関係から抽出法を提案した.移動経路の抽出は最良優先探索を用いた抽出法について提案した.被験者3名の生活圏を抽出し,適合率,再現率を用いて評価した.提案手法は頻度のみで抽出する手法より適合率が最大約0.5増加し,再現率は最大0.6増加した.この結果から提案手法が有効であることが確認された.

    CiNii Article

    CiNii Books

    researchmap

  • 移動経路のパターン分類による人の行動分析 (ライフインテリジェンスとオフィス情報システム)

    瀬藤 諒, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 500 )   31 - 36   2015年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告では,人がどの程度行動的であるのかという行動特徴に着目し,位置情報を用いた人の行動分析を検討した.移動経路データを用いて,主成分分析(PCA)と非負債行列因子分解(NMF)のそれぞれの手法により,行動的であるかを判定できるかを検討した.結果より,PCAから求めた重要な固有値の数とNMFによる近似誤差は,行動的であるかを判定に有効であると確認できた.さらに,移動経路のパターン抽出を行うことで,PCAとNMFで抽出される移動経路パターンの違いを検討した.それにより,PCAでは頻度の多いパターンが抽出されるのに対し,NMFでは頻度の少ないパターンも抽出されることが明らかになった.

    CiNii Article

    CiNii Books

    researchmap

  • FLAG: 位置情報を基軸としたライフログ集約システム

    笠井昭範, 原直, 阿部匡伸

    研究報告ユビキタスコンピューティングシステム(UBI)   2014 ( 6 )   1 - 6   2014年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    GPS による位置情報を用いたアプリケーションやサービスが広く普及している.本研究では,GPS から取得した位置情報をもとに,様々なライフログを集約するシステム FLAG を開発した.FLAG では位置情報を滞在地と移動経路に分類して管理を行う.分類した位置情報は地図とタイムテーブル上に可視化され,滞在地にはユーザごとに個別の名称を登録する機能を設けた.また,様々なライフログを集約する例として Twitter における投稿時間から FLAG の持つ位置情報と結びつけを行う.これにより,位置情報を持たないライフログの地図上への可視化が可能となる.システムの評価では,6 名の被験者により滞在地の正解データを作成し,FLAG の滞在地検出精度について 2 種類の検出法を用いて比較を行った.結果, FLAG では元データに比べて高い精度による滞在地の検出が確認された.Recently, the application and the service which utilize location information from GPS have highly prevailed. In this paper, we developed the system called FLAG which aggregates the variety of Lifelog under location information. FLAG manages location information discriminate between moving and staying. With using FLAG, we visualize categorized location information on the map and the time table. And implement set the function which registers individual name according to users in the staying state. We also link the location information from FLAG to Twitter using the posting time for an example of aggregating various kinds of Lifelog, This function enables Lifelog to show on the map even if the Lifelog has no positional information. For an evaluation of the FLAG system, we created correct data of staying by six users. And we compared accuracies of staying by using two detection methods. As a result, we confirmed that FLAG can be detected high accuracy staying than the original data.

    CiNii Article

    CiNii Books

    researchmap

    その他リンク: http://id.nii.ac.jp/1001/00102345/

  • FLAG : 位置情報を基軸としたライフログ集約システム(「ユビキタスコンピューティング技術とサービスコンピューティング」及び一般)

    笠井 昭範, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告. SC, サービスコンピューティング   114 ( 157 )   29 - 34   2014年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    GPSによる位置情報を用いたアプリケーションやサービスが広く普及している.本研究では,GPSから取得した位置情報をもとに,様々なライフログを集約するシステムFLAGを開発した.FLAGでは位置情報を滞在地と移動経路に分類して管理を行う.分類した位置情報は地図とタイムテーブル上に可視化され,滞在地にはユーザごとに個別の名称を登録する機能を設けた.また,様々なライフログを集約する例としてTwitterにおける投稿時間からFLAGの持つ位置情報と結びつけを行う.これにより,位置情報を持たないライフログの地図上への可視化が可能となる.システムの評価では,6名の被験者により滞在地の正解データを作成し,FLAGの滞在地検出精度について2種類の検出法を用いて比較を行った.結果,FLAGでは元データに比べて高い精度による滞在地の検出が確認された.

    CiNii Article

    CiNii Books

    researchmap

  • スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発 (音声 音学シンポジウム2014)

    原 直, 笠井 昭範, 阿部 匡伸, 曽根原 登

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 52 )   177 - 180   2014年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする.例えば,環境音の一つとして環境騒音問題を考えると,車や鉄道などの特徴的な音だけではなく,道や公園の賑わいのような生活雑音も考慮する必要がある.しかし,日常的かつ広範囲な音を少人数で収録することは容易ではない.そこで,クラウドソーシングによる収録を行うことで,環境音測定に必要な膨大な空間を覆うことを目指す.Android OSを搭載したスマートデバイスで動作するアプリケーションの試作を行い,さらに収録音の集積と閲覧のためのサーバシステムの試作を行った.本報告では開発した環境音収集システムの概要と環境音収録実験について紹介する.

    CiNii Article

    CiNii Books

    researchmap

  • GPSデータから構築したネットワークにおけるノード次数に基づく行動分析法の検討

    藤岡大輔, 原直, 阿部匡伸

    研究報告ユビキタスコンピューティングシステム(UBI)   2014 ( 6 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    個人の位置情報履歴から構築したネットワークの構造的特徴を基に個人の行動分析を行う手法について検討する.本報告では,GPS から取得した位置情報履歴を利用して構築された有向ネットワークを滞在地ネットワークと呼ぶ.滞在地ネットワークでは位置情報履歴から抽出された滞在地をノードとして扱う.一般に,有向なネットワークの個々のノードは出次数と入次数という構造的特徴量を持っている.滞在地ネットワークでは個々のノードが持つ出次数と入次数やそれらの比には偏りがある.そこで,この偏り度合いにはその滞在地における人の行動と関係性があると仮定して,その関係性を分析した.特に,人の行動結果の一つと考えられる滞在地の滞在目的に着目して,次数の偏り度合いと滞在目的との関係性について分析した.We discuss a behavior-anaysis method based on strucural features in networks constructed from a personal location history. In this paper, a directed network constructed from GPS location history is called a stay network. Stay network treat set of stay extratcted from the location history as nodes in networks. Generally, nodes of directed networks have out-degrees and in-degrees as structural features. The stay network has biased values of out-degrees, in-degrees and their ratio. Therefore, we assumed existance of relationships between the degree of biased values and human behaviors in the stay, and analyzed the relationships. We forcused on a purpose of the stay, which is assumed to be occur as a result of human behavior, and particularly analyzed relationships between the degree of biased values and the purpose of the stay.

    CiNii Article

    CiNii Books

    researchmap

  • スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発

    原 直, 笠井 昭範, 阿部 匡伸, 曽根原 登

    研究報告音楽情報科学(MUS)   2014 ( 36 )   1 - 4   2014年5月

     詳細を見る

    記述言語:日本語  

    本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする.例えば,環境音の一つとして環境騒音問題を考えると,車や鉄道などの特徴的な音だけではなく,道や公園の賑わいのような生活雑音も考慮する必要がある.しかし,日常的かつ広範囲な音を少人数で収録することは容易ではない.そこで,クラウドソーシングによる収録を行うことで,環境音測定に必要な膨大な空間を覆うことを目指す.Android OS を搭載したスマートデバイスで動作するアプリケーションの試作を行い,さらに収録音の集積と閲覧のためのサーバシステムの試作を行った[1].本報告では開発した環境音収集システムの概要と環境音収録実験について紹介する.In this study, we aimed to construct environmental sound database for various sounds as Wisdom of the crowds. For example, considering environmental noise-pollution problems as a kind of the environmental sound, we need to consider not only signature sound, e.g. car noise and railway noise, but also life-space noise, e.g. festivity noise on streets or in parks. However, daily/widely sound collection is difficult to substantiate by few participant. Therefore, we aimed to measure environmental sound covered a vast area by applying crowdsourcing approach. First, we develop a prototype application which is run on the smart device with Android OS, and then we develop a prototype server system for collection and browsing the collected sound data. Then, we calibrated noise level measured by smart devices and carried out a sound collection experiment for validate an accuracy of sensors on the smart devices [1]. In this report, we introduce the environemental sound collection system and the sound-collection experiment using the system.

    CiNii Article

    CiNii Books

    researchmap

  • 車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

    山岡 将綺, 原 直, 阿部 匡伸

    情報処理学会研究報告. SLP, 音声言語情報処理   2014 ( 7 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    運転中の利用に適した対話方法を提案するため,ユーザ負荷の観点で対話戦略を評価した.対話の主導権の方式と確認発話の方式を組み合わせて,客観評価実験である計算機シミュレーションを行った.シミュレーションの条件として,システムがユーザに余裕があるときのみ発話する条件と,ユーザが正しく聞き取れる割合の条件を設定した.また,これらの方式を実装した音声対話システムを利用した主観評価実験を行った.これらの評価から,ユーザ主導の対話戦略は認識率が高いとターン数やタスク達成時間が少なく優れているという結果を得た.一方,システム主導や混合主導の対話戦略は認識率が低い場合にターン数やタスク達成時間がユーザ主導の対話戦略よりも低く優れているという結果を得た.余裕があるときのみ発話する場合は,タスク達成までに時間がかかるため効率が悪いが,ユーザが感じる負担はほとんどないという結果を得た.We assess dialog strategies from user's workload standpoint to suggest usage of spoken dialog systems while driving. We evaluate several dialog strategies, which are combinations of methods of dialog initiative and confirmation manner, with objective evaluation method using computer simulation. Two conditions of the simulation are set up; One is that the system speaks if the user has leeway to talk with the system, and the another one is that the system speaks even if the user will be fail to recognize the system's. We also evaluate spoken dialog systems applying these methods with subjective evaluation method. As a result of the evaluations, user initiative strategy has advantages in lower turn number and lower task completion rate than both system initiative strategy and mixed initiative strategies when cognitive rate is high. The result also shows that system initiative strategy and mixed initiative strategy have advantages in lower turn number and lower task completion rate than user initiative strategy when cognitive rate is low. Additionally, the result shows that the method, which system speaks only when user has enough time driving operation, makes user's workload low, however, it need more time to complete tasks.

    CiNii Article

    CiNii Books

    researchmap

  • 非負値行列因子分解によるPC操作ログからの勤務パタン抽出 (ライフインテリジェンスとオフィス情報システム)

    平山 明彦, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   114 ( 32 )   33 - 38   2014年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告ではPC操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた.一日を単位とし,どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した.3つの職種を分析した結果,職種に依存する特徴的な勤務パタンを抽出することができた.また,一部には職種に共通する勤務パタンも抽出された.非負値行列因子分解の利点は基底の解釈が容易な点にあるが,抽出されたパタンから,あるソフトウェアをある時間帯に集中的に利用する勤務パタンや,複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した.

    CiNii Article

    CiNii Books

    researchmap

  • 車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

    山岡 将綺, 原 直, 阿部 匡伸

    研究報告自然言語処理(NL)   2014 ( 7 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    運転中の利用に適した対話方法を提案するため,ユーザ負荷の観点で対話戦略を評価した.対話の主導権の方式と確認発話の方式を組み合わせて,客観評価実験である計算機シミュレーションを行った.シミュレーションの条件として,システムがユーザに余裕があるときのみ発話する条件と,ユーザが正しく聞き取れる割合の条件を設定した.また,これらの方式を実装した音声対話システムを利用した主観評価実験を行った.これらの評価から,ユーザ主導の対話戦略は認識率が高いとターン数やタスク達成時間が少なく優れているという結果を得た.一方,システム主導や混合主導の対話戦略は認識率が低い場合にターン数やタスク達成時間がユーザ主導の対話戦略よりも低く優れているという結果を得た.余裕があるときのみ発話する場合は,タスク達成までに時間がかかるため効率が悪いが,ユーザが感じる負担はほとんどないという結果を得た.We assess dialog strategies from user's workload standpoint to suggest usage of spoken dialog systems while driving. We evaluate several dialog strategies, which are combinations of methods of dialog initiative and confirmation manner, with objective evaluation method using computer simulation. Two conditions of the simulation are set up; One is that the system speaks if the user has leeway to talk with the system, and the another one is that the system speaks even if the user will be fail to recognize the system's. We also evaluate spoken dialog systems applying these methods with subjective evaluation method. As a result of the evaluations, user initiative strategy has advantages in lower turn number and lower task completion rate than both system initiative strategy and mixed initiative strategies when cognitive rate is high. The result also shows that system initiative strategy and mixed initiative strategy have advantages in lower turn number and lower task completion rate than user initiative strategy when cognitive rate is low. Additionally, the result shows that the method, which system speaks only when user has enough time driving operation, makes user's workload low, however, it need more time to complete tasks.

    CiNii Article

    CiNii Books

    researchmap

  • 非負値行列因子分解によるPC操作ログからの勤務パタン抽出

    平山 明彦, 原 直, 阿部 匡伸

    研究報告セキュリティ心理学とトラスト(SPT)   2014 ( 6 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語  

    本報告では PC 操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた.一日を単位とし,どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した.3 つの職種を分析した結果,職種に依存する特徴的な勤務パタンを抽出することができた.また,一部には職種に共通する勤務パタンも抽出された.非負値行列因子分解の利点は基底の解釈が容易な点にあるが,抽出されたパタンから,あるソフトウェアをある時間帯に集中的に利用する勤務パタンや,複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した.In this paper, we tried to extract working patterns by nonnegative matrix factorization using PC operation logs. Experiments were carried out for three occupations, in terms of daily-basis working patterns, we successfully extracted particular patterns for each occupation and some common working patterns for all occupations. We also presented that the extracted patterns can be easily interpreted as the ways of working.

    CiNii Article

    CiNii Books

    researchmap

  • 非負値行列因子分解によるPC操作ログからの勤務パタン抽出

    平山 明彦, 原 直, 阿部 匡伸

    研究報告グループウェアとネットワークサービス(GN)   2014 ( 6 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語  

    本報告では PC 操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた.一日を単位とし,どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した.3 つの職種を分析した結果,職種に依存する特徴的な勤務パタンを抽出することができた.また,一部には職種に共通する勤務パタンも抽出された.非負値行列因子分解の利点は基底の解釈が容易な点にあるが,抽出されたパタンから,あるソフトウェアをある時間帯に集中的に利用する勤務パタンや,複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した.In this paper, we tried to extract working patterns by nonnegative matrix factorization using PC operation logs. Experiments were carried out for three occupations, in terms of daily-basis working patterns, we successfully extracted particular patterns for each occupation and some common working patterns for all occupations. We also presented that the extracted patterns can be easily interpreted as the ways of working.

    CiNii Article

    CiNii Books

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式の検討

    林啓吾, 原直, 阿部匡伸

    第76回全国大会講演論文集   2014 ( 1 )   459 - 460   2014年3月

     詳細を見る

    記述言語:日本語  

    ライフログとは,人間の行動をデジタルデータとして記録に残すことである.ライフログデータを用いて自分の行動を振り返ることを考える.例えば,現在広く普及しているSocial Networking Service(SNS)の過去の発言や写真を見返すことで,振り返りが可能であるが,それらに記録するのは自分の意志で記録したいと思ったことに限られてしまうという問題点がある.無意識に記録できるライフログデータの一つに,Global Positioning System (GPS) による位置情報データ(GPS データ)があげられる.本研究では,GPSデータから得られる滞在地の特徴量を利用し,振り返りたいと感じる「特別な日」を検索する方式を提案した.評価実験により,提案方式で「特別な日」が高い精度で検索可能であることが示された.

    CiNii Article

    CiNii Books

    researchmap

  • 滞在地と経路に着目した生活圏抽出法の検討

    松尾雄二, 原直, 阿部匡伸

    第76回全国大会講演論文集   2014 ( 1 )   37 - 38   2014年3月

     詳細を見る

    記述言語:日本語  

    近年、高齢者による徘徊行動が社会問題となっている。既存の見守りシステムではあらかじめ行動範囲を設定する必要があり、その範囲も詳細に決定できないため十分な見守りが不可能である。 そこで、本研究では蓄積したGPSデータを用いて見守りシステムに応用するための生活圏(行動範囲)を抽出する方法を検討する。GPSデータに含まれる位置情報(緯度経度)をGEOHEXを用いてHEXコードという量子化符号に変換する。それらのHEXコードを滞在地と経路に分類し、頻度の高いHEXコードをそれぞれの生活圏として抽出し、滞在地に属するデータの生活圏と経路に属するデータの生活圏の整合性を評価した。

    CiNii Article

    CiNii Books

    researchmap

  • D-9-4 他人との行動ログ比較による個人の行動特徴分析(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)

    瀬藤 諒, 阿部 匡伸, 原 直

    電子情報通信学会総合大会講演論文集   2014 ( 1 )   88 - 88   2014年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    CiNii Books

    researchmap

  • クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

    原直, 笠井昭範, 阿部匡伸, 曽根原登

    電子情報通信学会技術研究報告   113 ( 479 )   29 - 34   2014年3月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする.例えば,環境音の一つとして環境騒音問題を考えると,車や鉄道などの特徴的な音だけではなく,道や公園の賑わいのような生活雑音も考慮する必要がある.しかし,日常的かつ広範囲な音を少人数で収録することは容易ではない.そこで,クラウドソーシングによる収録を行うことで,環境音測定に必要な膨大な空間を覆うことを目指す. Android OSを搭載したスマートデバイスで動作するアプリケーションの試作を行い,さらに収録音の集積と閲覧のためのサーバシステムの試作を行った.また,スマートデバイス搭載のセンサ群の精度を検証するために,騒音レベルの校正と環境音収録実験を行った.実験では900分の環境音データを収録し,収録された騒音レベルと主観的な評価値の関係性を分析した.

    CiNii Article

    CiNii Books

    researchmap

  • 音声波形の高域利用によるHMM音声合成方式の評価

    井上 拓真, 原 直, 阿部 匡伸

    日本音響学会研究発表会講演論文集 日本音響学会 編   349 - 352   2014年

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Article

    researchmap

  • クラウドセンシングにより収集された環境音のシンボル表現を用いた音地図構築手法

    原 直, 阿部 匡伸, 曽根原 登

    日本音響学会研究発表会講演論文集 日本音響学会 編   1535 - 1538   2014年

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Article

    researchmap

  • 音素波形選択型音声合成方式に用いるデータベースサイズと主観評価との関係分析

    稻井 禎, 原 直, 阿部 匡伸

    日本音響学会研究発表会講演論文集 日本音響学会 編   331 - 334   2014年

     詳細を見る

    記述言語:日本語   出版者・発行元:日本音響学会  

    CiNii Article

    researchmap

  • 音響信号とマルチセンサー信号を利用したスマートフォンによる自動車の燃費推定 (信号処理)

    難波 祥平, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113 ( 28 )   1 - 6   2013年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    自動車の燃費計が搭載された車が増えているが,燃費データは表示するだけであり,外部へ出力して蓄積や分析などの再利用は行えない.外部へ車両のデータを出力する方法としては,診断用コネクタを利用してOBD2規格のデータから速度,回転数燃料消費率を取り出す方法がある.しかし,プロトコルがメーカーや車種により異なっているため,一般利用には向いていない.本研究ではスマートフォンで得られる音響信号と各種センサーの値を用いて自動車の燃費推定を行う.燃費推定にはエンジン回転数の推定とトルクの推定が必要となる.エンジン回転数は,エンジン音に高速フーリエ変換を行い,混合ガンマ分布で近似したロードノイズを除去した音響信号から求める.トルクは各種センサーの値と自動車の諸元から自動車の物理法則を用いて求める.得られたエンジン回転数とトルクに対して,事前に収集した燃料消費率の対応表を用いて燃費を推定する.スマートフォンを用いた燃費推定の実験の結果,最終的な平均燃費に誤差があるものの,瞬間燃費の大まかな変化を知るという目的に十分な数値が得られた.

    CiNii Article

    CiNii Books

    researchmap

  • GPSデータから抽出した滞在地のネットワークにおける個人の特徴分析 (ライフインテリジェンスとオフィス情報システム)

    藤岡 大輔, 原 直, 阿部 匡伸

    電子情報通信学会技術研究報告 : 信学技報   112 ( 466 )   179 - 184   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本報告ではGPSロガーによって取得したデータから個人毎の滞在地のネットワークを作り,ネットワーク構造に着目した新たな行動分析の手法について述べる.本報告では6名の被験者のGPSデータを用いて滞在地のネットワークのスケールフリー性,スモールワールド性,クラスター性を分析し,身の回りの他のネットワークとの比較,またモチーフの分布から滞在地のネットワーク特有の点を分析した.さらにノード間の繋がり方に着目し,ハブとなっている度合いと,そのノードに出入りするノードの種類数の偏りを数値化することで,被験者間でのネットワークの違いを明らかにした.

    CiNii Article

    CiNii Books

    researchmap

  • 他者のライフログからの類似した印象を持つイベント抽出法の検討 (ライフインテリジェンスとオフィス情報システム)

    濱野 和人, 阿部 匡伸, 原 直, 藤岡 大輔, 望月 理香, 渡部 智樹

    電子情報通信学会技術研究報告 : 信学技報   112 ( 466 )   173 - 178   2013年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    自身の経験を相手に伝えるとき,同様な印象を想起するような相手の過去の経験に置き換えて説明することで,理解を深められることがある.そこで本稿では,ライフログから伝え手と受け手が同様な印象を持つイベントを抽出する方法について検討した.まず,数種類の感情を提示して,被験者に幾つかのイベントを思い出させた.これらのイベントに対し,各イベントから想起される感情を項目ごとに数値化させて類似度を求める方法と,ディスカッションにより各イベントの類似度を決める方法とを比較した.その結果,ディスカッションによる方法による類似度の決定ではイベントに対する強い感情が主たる要因となっていることが明らかになった.

    CiNii Article

    CiNii Books

    researchmap

  • 音声情報案内システムにおけるBag‐of‐Wordsを用いた無効入力棄却モデルの可搬性の評価

    真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会研究発表会講演論文集(CD-ROM)   2013   ROMBUNNO.3-9-5   2013年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 学生・若手フォーラム第2期活動報告(活動報告)

    岡本 拓磨, 奥園 健, 木谷 俊介, 原 直, 太田 達也, 井本 桂右

    日本音響学会誌   69 ( 9 )   519 - 520   2013年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本音響学会  

    DOI: 10.20697/jasj.69.9_519

    CiNii Article

    researchmap

  • 音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

    真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会研究発表会講演論文集(CD-ROM)   2012   ROMBUNNO.3-1-8   2012年9月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

    真嶋 温佳, 藤田 洋子, トーレス ラファエル, 川波 弘道, 原 直, 松井 知子, 猿渡 洋, 鹿野 清宏

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 7 )   1 - 6   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    実環境音声情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する.これらの入力はシステムの誤作動・誤認識の原因となるので,無効入力として棄却して応答処理を行わないことが重要である.一般に,有効入力と無効入力との識別にはGMM (Gaussian Mixture Model) による方法など,音響的な情報に基づく方法が用いられることが多い.しかし,入力データに含まれる言語的な情報を使うことにより,システムのタスクも考慮した,より高精度な有効入力と無効入力の識別が可能になると考えられる.そこで本論文では,音声認識結果から得られるBag-of-Words (BOW) を特徴量として,サポートベクターマシン(SVM)および最大エントロピー法を用いた無効入力の識別を検討した.実環境音声情報案内システム「たけまるくん」の入力データを用いた実験では,GMMを用いたSVMによる無効入力の識別と較べ,F尺度を81.73%から83.61%に改善することができた.また,BOW,GMMによる音響尤度,発話時間,SNRを組み合わせた場合,F尺度を86.57%まで改善することができた.

    CiNii Article

    CiNii Books

    researchmap

  • クラウド時代の新しい音声研究パラダイム

    秋葉 友良, 岩野 公司, 緒方 淳, 小川 哲司, 小野 順貴, 篠崎 隆宏, 篠田 浩一, 南條 浩輝, 西崎 博光, 西田 昌史, 西村 竜一, 原 直, 堀 貴明

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 4 )   1 - 7   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    個人が複数の携帯情報端末を所有し,そこで得られたあらゆる音声データをクラウドに蓄積することが容易になりつつある.このように音声情報処理の周辺環境・技術が激変していく中で,音声情報処理技術のより一層の高度化が求められている.その期待に応えるためには,クラウド処理を前提とした音声研究プラットフォームの構築と,それを基盤とした新しい音声研究のパラダイムが必要である.本稿では,現在までに培われてきた音声情報処理技術を概観した上で,新しい研究パラダイムの方向性とそこで生じる新たな課題について議論する.

    CiNii Article

    CiNii Books

    researchmap

  • 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

    原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏

    情報処理学会研究報告. SLP, 音声言語情報処理   2012 ( 1 )   1 - 6   2012年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本論文では携帯端末用の音声情報案内システム開発に向けたネットワークサービスソフトウェアの開発について検討する.このソフトウェアは2002年11月よりコミュニティセンターに設置されたたけまるくんシステムを基礎としている.本システムは,音声認識,対話管理,テキスト音声合成を統合したシステムである.WWWサイト開発者にも使いやすいような,Software-as-a-Service (SaaS) を目指すとともに,熟練した開発者や研究者にも使いやすいパッケージとしての展開を検討する.

    CiNii Article

    CiNii Books

    researchmap

  • D-9-36 多様な利用環境における音声情報案内サービスソフトウェアの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)

    原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏

    電子情報通信学会総合大会講演論文集   2012 ( 1 )   168 - 168   2012年3月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    CiNii Books

    researchmap

  • ブラインド音源分離の信頼度を用いたマルチバンド音声認識 (音声)

    安藤 厚志, 大橋 宏正, 原 直, 北岡 教英, 武田 一哉

    電子情報通信学会技術研究報告 : 信学技報   111 ( 431 )   219 - 224   2012年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    ブラインド音源分離は音声認識の精度の向上に応用されるが,従来の音源分離法は音声認識の単なる前処理としてしか利用されなかった.本稿では,周波数領域独立成分分析によるブラインド音源分離法と組み合わせたマルチバンド音声認識手法を提案する.音源分離時において,各周波数ごとの分離行列の正確さを推定し,その周波数の信頼度とする.次段の処理では,音源分離の信頼度とメル尺度フィルタバンクエネルギーに基づきマルチバンド音声認識手法により音響尤度を計算する.提案法では音源分離行列の推定誤りとICA後のdepermutation誤りを原因とする認識誤りを削減することが可能となる.提案法を用いて雑音下での孤立単語認識実験を行った結果,単語正解率が平均8.2%,単語正解精度が平均5.7%向上することを確認した.

    CiNii Article

    CiNii Books

    researchmap

  • 多様な利用環境における音声情報案内サービスソフトウェアの開発

    原直

    信学総大講演論文集, 2012   168   2012年

  • MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル (音声言語情報処理(SLP) Vol.2010-SLP-84)

    伊藤 新, 原 直, 北岡 教英

    情報処理学会研究報告   2010 ( 5 )   1 - 6   2011年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:情報処理学会  

    CiNii Article

    CiNii Books

    researchmap

  • MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル (音声)

    伊藤 新, 原 直, 北岡 教英

    電子情報通信学会技術研究報告   110 ( 357 )   55 - 60   2010年12月

     詳細を見る

    出版者・発行元:電子情報通信学会  

    CiNii Article

    researchmap

  • 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)

    大橋 宏正, 北岡 教英, 原 直, 武田 一哉

    電子情報通信学会技術研究報告. SP, 音声   110 ( 220 )   59 - 64   2010年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人電子情報通信学会  

    音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.

    CiNii Article

    CiNii Books

    researchmap

  • 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 (言語理解とコミュニケーション)

    原 直, 北岡 教英, 武田 一哉

    電子情報通信学会技術研究報告   109 ( 355 )   77 - 82   2009年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    CiNii Article

    researchmap

  • 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

    原 直, 北岡 教英, 武田 一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2009 ( 14 )   1 - 6   2009年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人情報処理学会  

    本論文では,音声対話システムの対話履歴を N-gram によってモデル化を行い、その尤度に基づいてユーザ満足度の推定を行う手法を提案する.実験では音声対話による楽曲検索システムを利用した実環境音声データに収録されているユーザとシステムの対話履歴を利用して各ユーザの満足度を N-gram の尤度を用いて推定する.それぞれの満足度レベル毎の N-gram モデルは,ユーザの対話行動とシステムの対話行動を符号化した系列を利用することで作成される.本論文では,作成したモデルを用いて満足度の推定を行いその分類性能を評価した.実験結果より,提案手法は高い分類性能を示しており,特にタスク達成者とタスク未達成者の分類では全てのタスク未達成者を検出する際の誤検出率を 10% に抑えることができた.

    CiNii Article

    CiNii Books

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル

    原 直, 北岡 教英, 武田 一哉

    電子情報通信学会技術研究報告. SP, 音声   108 ( 338 )   61 - 66   2008年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフィールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

    CiNii Article

    CiNii Books

    researchmap

  • 多様な利用環境における楽曲検索音声対話システムのフィールドテストと評価

    原直, 宮島千代美, 伊藤克亘, 北岡教英, 武田一哉

    情報処理学会第70回全国大会講演論文集   70 ( 5 (3L-4) )   5-341 - 5-342   2008年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    CiNii Article

    CiNii Books

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)

    原直, 北岡教英, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2008 ( 123 )   61 - 66   2008年

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人情報処理学会  

    楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフイールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

    CiNii Article

    CiNii Books

    researchmap

  • 多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)

    原 直, 宮島 千代美, 伊藤 克亘, 武田 一哉

    電子情報通信学会論文誌. D, 情報・システム   90 ( 10 )   2807 - 2816   2007年10月

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人電子情報通信学会  

    多様なPC利用環境において音声認識の被験者実験を行うために,WWWを利用した音声対話システム及びそのデータ収集システムを構築した.本システムのユーザはPC上にインストールされたクライアントプログラムを用いることで音声対話によりPC内に蓄積された音楽を再生したり,音楽ダウンロードサイトの楽曲を試聴することができる.クライアントプログラムの利用により収集された音声データや対話ログはインターネットを介してサーバ上に蓄積される.サーバには,ユーザごとの辞書のカスタマイズ等の機能も実装している.本システムをインターネット上で試験的に公開し,2か月間のフィールドテストとしてデータ収集を行ったところ合計59時間のシステム稼動時データを収集した.そのうち約5時間41分のデータ(11351個)が音声区間として検出されており,システムに対して発話されていた音声データとして6335発話を得た.

    CiNii Article

    CiNii Books

    researchmap

  • 楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討(音響・音韻モデル)

    原直, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2007 ( 75 )   87 - 90   2007年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人情報処理学会  

    本論文では楽曲検索システムの音声インタフェースに適用するための与えられた認識語彙集合に最適なHMM 音響モデルを学習するための手法について述べる。本論文が対象とする楽曲検索アプリケーションにおいては各ユーザ毎にHMM 音響モデルをカスタマイズすることが重要である、なぜなら、1)楽曲名やアーティスト名には一般的なテキスト読み上げコーパスには出現しないような音韻コンテキストが存在すること、2)ユーザによって蓄積している音楽が異なっていること、が理由としてあげられる。特に、認識語彙集合に対して最適な状態共有構造を探すということは音響モデルの学習における新しい問題である。そこで本研究では100名以上の話者による合成音声を用いてタスクに関連した語彙発話を生成しタスク依存音響モデルを構築する手法を提案する。フィールドテストによる評価実験の結果、提案手法により作成したタスク依存音響モデルはタスク非依存音響モデルに比べて約10%の単語誤り削減率を達成することを確認した。

    CiNii Article

    CiNii Books

    researchmap

  • 楽曲検索音声対話システムの評価 (感性)

    原 直, 伊藤 克亘, 北岡 教英

    シンポジウムモバイル研究論文集   2007   47 - 50   2007年

     詳細を見る

    記述言語:日本語   出版者・発行元:モバイル学会  

    CiNii Article

    researchmap

  • 汎用PC上で利用された音声対話システムによる音声収集と評価

    原 直, 宮島 千代美, 伊藤 克亘, 武田 一哉

    電子情報通信学会技術研究報告. SP, 音声   106 ( 443 )   167 - 172   2006年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    実際の利用環境に近づけた被験者実験を行うために,WWW経由でカスタマイズ可能な音声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される.本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.

    CiNii Article

    CiNii Books

    researchmap

  • 汎用PC上で利用された音声対話システムによる音声収集と評価(第8回音声言語シンポジウム)

    原直, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2006 ( 136 )   167 - 172   2006年

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人情報処理学会  

    実際の利用環境に近づけた被験者実験を行うために, WWW経由でカスタマイズ可能な音声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される.本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.

    CiNii Article

    CiNii Books

    researchmap

  • 長期間の音声対話インタフェース利用時における学習効果の評価

    原 直, 白勢 彩子, 宮島 千代美, 伊藤 克亘, 武田 一哉

    日本音響学会研究発表会講演論文集   2005 ( 1 )   153 - 154   2005年3月

     詳細を見る

  • 音声対話インタフェースの長期利用時における学習効果の評価

    原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2005 ( 12 )   17 - 22   2005年

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人情報処理学会  

    本研究では車内での利用を想定した音声対話による楽曲検索システムを構築している.このシステムは, ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.以前の報告ではユーザが約1時間の間システムを利用する実験を行った.この実験において被験者によって度合は異なるものの, 習熟することにより認識性能が向上するという知見が得られた.そこで, 本報告では, 被験者がシステムに十分慣れるように, 1時間のセッションを5回繰り返す実験を行った.実験により収録した12名の音声を分析した結果, 最終日において初日の約60%の誤り改善率を得た.

    CiNii Article

    CiNii Books

    researchmap

  • 音声対話による楽曲検索システム(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)

    原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

    情報処理学会研究報告. SLP, 音声言語情報処理   2004 ( 103 )   31 - 36   2004年2月

     詳細を見る

    記述言語:日本語   出版者・発行元:社団法人情報処理学会  

    近年,音声認識技術を用いた様々なアプリケーションが考えられている.例えば,ハンズフリーで利用できるという特徴を生かして,カーナビゲーションシステムなどに利用されている.また,インターネット経由の楽曲ダウンロードシステムが増えており,使いやすい楽曲検索インタフェースへの期待が高まっている.そこで本研究では車内での利用を想定した音声対話による楽曲検索システムを作成した.このシステムは,ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.本報告ではシステムの詳細及びシステムを用いた音声対話の収録について述べる.プロトタイプを用いて約150名の被験者実験を行った結果,室内で約80%,実車運転時で約76%の単語正解率を得た.

    CiNii Article

    CiNii Books

    researchmap

  • ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討

    白勢 彩子, 原 直, 藤村 浩司, 伊藤 克亘, 武田 一哉, 板倉 文忠

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   103 ( 518 )   7 - 12   2003年12月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人電子情報通信学会  

    本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ,会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.

    CiNii Article

    CiNii Books

    researchmap

  • ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討

    白勢彩子, 原直, 藤村浩司, 伊藤克亘, 武田一哉, 板倉文忠

    情報処理学会研究報告   2003 ( 124 (2003-SLP-049) )   253 - 258   2003年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ、会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.

    CiNii Article

    CiNii Books

    researchmap

  • 汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価

    原直, 河口信夫, 武田一哉, 板倉文忠

    情報処理学会研究報告   2003 ( 14 (2002-SLP-045) )   131 - 136   2003年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)   出版者・発行元:社団法人情報処理学会  

    携帯情報端末(PDA)での音声認識の研究を進めるために,汎用音声認識エンジンJulius/JulianをPDA上に移植し,その性能評価を行った.その結果,孤立単語音声認識では,Linux上で動作させた場合に比べて認織率はわずかに低下するが,PDAで実時間の約1.9倍で90%の認識率を得ることができた.連続数字音声認識ではPDAで収録した音声で学習することにより,約99%の認識率を得た.

    CiNii Article

    CiNii Books

    researchmap

▼全件表示

講演・口頭発表等

  • 人対人の会話で自然な話題展開を支援するための対話戦略の検討

    前薗そよぎ, 原直, 阿部匡伸

    音学シンポジウム2021(情報処理学会 音声言語処理研究会)  2021年6月18日  情報処理学会

     詳細を見る

    開催年月日: 2021年6月18日 - 2021年6月19日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

    長塚弘亮, 川上滋央, 古寺寛志, 佐藤匡晃, 田中祐貴, 兒玉直紀, 原直, 皆木省吾

    日本顎顔面補綴学会 第38回総会・学術大会  2021年6月4日 

     詳細を見る

    開催年月日: 2021年6月3日 - 2021年6月5日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • ニューラル機械翻訳により推定された読み仮名・韻律記号を入力とする日本語 End-to-End 音声合成の評価

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2021年春季研究発表会  2021年3月11日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Evaluation of Concept Drift Adaptation for Acoustic Scene Classifier Based on Kernel Density Drift Detection and Combine Merge Gaussian Mixture Model

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    日本音響学会2021年春季研究発表会  2021年3月10日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 歌唱表現を付与できるBidirectional-LSTM を用いた歌声合成方式の検討

    金子隼人, 原直, 阿部匡伸

    日本音響学会2021年春季研究発表会  2021年3月10日  日本音響学会

     詳細を見る

    開催年月日: 2021年3月10日 - 2021年3月12日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • TTSによる会話支援システムのための感圧センサを用いた手袋型入力デバイスの開発と入力速度の評価

    小林誠, 原直, 阿部匡伸

    情報処理学会 第190回ヒューマンコンピュータインタラクション研究発表会  2020年12月9日  情報処理学会

     詳細を見る

    開催年月日: 2020年12月8日 - 2020年12月9日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:淡路夢舞台国際会議場&オンライン  

    researchmap

  • Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 国際会議

    Katsuki Inoue, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2020  2020年12月  APSIPA

     詳細を見る

    開催年月日: 2020年12月7日 - 2020年12月10日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Auckland, New Zealand (Virtual/Online)  

    researchmap

    その他リンク: https://ieeexplore.ieee.org/document/9306250

  • Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 国際会議

    Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

    The 2020 IEEE Region 10 Conference (IEEE-TENCON 2020)  2020年11月  IEEE

     詳細を見る

    開催年月日: 2020年11月16日 - 2020年11月19日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Osaka, Japan (Virtual/Online)  

    researchmap

  • Controlling the Strength of Emotions in Speech-like Emotional Sound Generated by WaveNet 国際会議

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    Interspeech 2020  2020年10月  ISCA

     詳細を見る

    開催年月日: 2020年10月25日 - 2020年10月29日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Shanghai, China (Virtual/Online)  

    researchmap

  • パーキンソン病重症度推定のためのインソール型圧力センサを用いた時間的特徴量の検討

    林倖生, 原直, 阿部匡伸

    2020年度(第71回)電気・情報関連学会中国支部連合大会  2020年10月24日 

     詳細を見る

    開催年月日: 2020年10月24日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定

    懸川直人, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2020年秋季研究発表会  2020年9月11日  日本音響学会

     詳細を見る

    開催年月日: 2020年9月9日 - 2020年9月11日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    researchmap

  • WaveNetを用いた言語情報なし感情音声合成における感情の強さ制御の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2020年秋季研究発表会  2020年9月10日  日本音響学会

     詳細を見る

    開催年月日: 2020年9月9日 - 2020年9月11日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン  

    researchmap

  • 映像と音声を用いた議論への関与姿勢や肯定的・否定的態度の推定方式の検討

    金岡翼, 上原佑太郎, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)  2020年6月26日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月24日 - 2020年6月26日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • GPSデータのクラスタリングによる日常生活における場所の重要度の分析

    平田瑠,原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2020)  2020年6月25日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月24日 - 2020年6月26日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End 音声認識を用いた音声合成の半教師あり話者適応 国際共著

    井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

    音学シンポジウム2020(エキシビションASJ代替発表)  2020年6月7日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月6日 - 2020年6月7日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 話題の対象に対する親密度に応じて応答する音声対話システムの検討

    加藤大地, 原直, 阿部匡伸

    音学シンポジウム2020(情報処理学会 音声言語処理研究会)  2020年6月6日  情報処理学会

     詳細を見る

    開催年月日: 2020年6月6日 - 2020年6月7日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • Semi-supervised speaker adaptation for end-to-end speech synthesis with the pretrained models 国際共著 国際会議

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

    ICASSP 2020  2020年5月  IEEE

     詳細を見る

    開催年月日: 2020年5月4日 - 2020年5月8日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Barcelona, Spain (Virtual/Online)  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための推定音素事後確率を用いた声質変換の検討

    荻野聖也, 原直, 阿部匡伸

    電子情報通信学会総合大会  2020年3月17日  電子情報通信学会

     詳細を見る

    開催年月日: 2020年3月17日 - 2020年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 言語情報なし感情合成音を学習に用いたCycleGANによる感情変換方式の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2020年春季研究発表会  2020年3月18日  日本音響学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End 音声認識を用いた音声合成の半教師あり話者適応 国際共著

    井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

    日本音響学会2020年春季研究発表会  2020年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • ウェアラブルデバイスによる曖昧な入力からのニューラル機械翻訳を用いた日本語文章推定方式

    渡邊淳,原直, 阿部匡伸

    情報処理学会研究報告  2020年3月16日  情報処理学会

     詳細を見る

    開催年月日: 2020年3月16日 - 2020年3月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • End-to-End⾳声認識を⽤いたEnd-to-End⾳声合成の性能評価 国際共著

    井上勝喜, 原直, 阿部匡伸, 渡部晋治

    第22回 ⽇本⾳響学会 関⻄⽀部若⼿研究者交流研究発表会  2019年11月30日  日本音響学会関西支部

     詳細を見る

    開催年月日: 2019年11月30日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients’ Speech

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月19日  APSIPA

     詳細を見る

    開催年月日: 2019年11月18日 - 2019年11月21日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • Speech-like Emotional Sound Generator by WaveNet 国際会議

    Kento Matsumoto, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月  APSIPA

     詳細を見る

    開催年月日: 2019年11月18日 - 2019年11月21日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • WaveNet による言語情報を含まない感情音声合成方式における話者性の検討

    松本剣斗, 原直, 阿部匡伸

    日本音響学会2019年秋季研究発表会  2019年9月6日  日本音響学会

     詳細を見る

    開催年月日: 2019年9月4日 - 2019年9月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:立命館大BKCキャンパス(滋賀県草津市)  

    researchmap

  • 新たにデザインされた人工舌と解剖学的人工舌の効果ならびにその選択基準

    佐藤匡晃, 長塚弘亮, 川上滋央, 兒玉直紀, 原直, 阿部匡伸, 皆木省吾

    日本補綴歯科学会 中国・四国支部学術大会  2019年9月1日  日本補綴歯科学会 中国・四国支部

     詳細を見る

    開催年月日: 2019年8月31日 - 2019年9月1日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島県福山市  

    researchmap

  • A signal processing perspective on human gait: Decoupling walking oscillations and gestures 国際共著 国際会議

    Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

    The 4th International Conference on Interactive Collaborative Robotics (ICR 2019)  2019年8月  SPECOM

     詳細を見る

    開催年月日: 2019年8月20日 - 2019年8月25日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Istanbul, Turkey  

    researchmap

  • GPSデータに基づく日常生活における特別な行動の検出

    小林誠,原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)  2019年7月4日  情報処理学会

     詳細を見る

    開催年月日: 2019年7月3日 - 2019年7月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:磐梯熱海温泉華の湯(福島県)  

    researchmap

  • CNN Autoencoder から抽出したボトルネック特徴量を用いた環境音分類

    松原拓未, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2019)  2019年7月3日  情報処理学会

     詳細を見る

    開催年月日: 2019年7月3日 - 2019年7月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:磐梯熱海温泉華の湯(福島県)  

    researchmap

  • WaveNetによる言語情報を含まない感情音声合成方式の検討

    松本剣斗, 原直, 阿部匡伸

    音学シンポジウム2019 (SIG-MUS, SIG-SLP)  2019年6月23日  情報処理学会

     詳細を見る

    開催年月日: 2019年6月22日 - 2019年6月23日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:京都大学 吉田キャンパス(京都府)  

    researchmap

  • i-vectorに基づく賑わい音の推定方式の検討

    呉 セン陽, 朝田興平, 原直, 阿部匡伸

    音学シンポジウム2019 (SIG-MUS, SIG-SLP)  2019年6月22日  情報処理学会

     詳細を見る

    開催年月日: 2019年6月22日 - 2019年6月23日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:京都大学 吉田キャンパス(京都府)  

    researchmap

  • 舌亜全摘出者の音韻明瞭度改善のための Bidirectional LSTM-RNN に基づく音素補助情報を用いた声質変換方式の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会2019年春季研究発表会  2019年3月4日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための音素補助情報の推定方式の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    日本音響学会2019年春季研究発表会  2019年3月4日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

    井上勝喜, 原直, 阿部匡伸, 井島勇祐

    日本音響学会2019年春季研究発表会  2019年3月3日  日本音響学会

     詳細を見る

    開催年月日: 2019年3月3日 - 2019年3月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:電気通信大学  

    researchmap

  • ながら聴き用楽曲の作業負荷に及ぼす影響とその選択方式の検討

    高瀬郁, 阿部匡伸, 原直

    第121回SIGMUS研究会  2018年11月21日  情報処理学会

     詳細を見る

    開催年月日: 2018年11月21日 - 2018年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:ホテルこうしゅうえん(石川県輪島市)  

    researchmap

  • クラウドソーシングによる環境音マップ構築のための主観的な騒々しさ推定方式の検討

    原直, 阿部匡伸

    第17回情報科学技術フォーラム(FIT 2018)  2018年9月20日  情報処理学会

     詳細を見る

    開催年月日: 2018年9月19日 - 2018年9月21日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:福岡工業大学  

    researchmap

  • Speech Enhancement of Glossectomy Patient’s Speech using Voice Conversion Approach

    Masanobu Abe, Seiya Ogino, Hiroki Murakami, Sunao Hara

    日本生物物理学会第56回年会,シンポジウム:ヘルスシステムの理解と応用  2018年9月15日  日本生物物理学会

     詳細を見る

    開催年月日: 2018年9月15日 - 2018年9月17日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:岡山大学 津島キャンパス  

    researchmap

  • 声質変換による舌亜全摘出者の音韻明瞭度改善のための補助情報の検討

    村上博紀, 原直, 阿部匡伸

    日本音響学会2018年秋季研究発表会  2018年9月12日  日本音響学会

     詳細を見る

    開催年月日: 2018年9月12日 - 2018年9月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大分大学 旦野原キャンパス  

    researchmap

  • DNN音声合成における感情付与方式の評価

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2018年秋季研究発表会  2018年9月12日  日本音響学会

     詳細を見る

    開催年月日: 2018年9月12日 - 2018年9月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大分大学 旦野原キャンパス  

    researchmap

  • Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient’s Speech Using Spectral Differential Modification in Voice Conversion

    Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2018  2018年9月5日  ISCA

     詳細を見る

    開催年月日: 2018年9月2日 - 2018年9月6日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hyderabad, India  

    researchmap

  • 音声と口唇形状を用いた声質変換による舌亜全摘出者の音韻明瞭度改善の検討

    荻野聖也, 村上博紀, 原直, 阿部匡伸

    音声研究会  2018年6月28日  電子情報通信学会

     詳細を見る

    開催年月日: 2018年6月28日 - 2018年6月29日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:信州大学 長野(工学)キャンパス  

    researchmap

  • 舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

    村上博紀,荻野聖也,原直,阿部匡伸,佐藤匡晃,皆木省吾

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • クラウドソーシングによる賑わい音識別方式のフィールド実験評価

    朝田興平,原直,阿部匡伸

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • DNN音声合成における感情付与のための継続時間長モデルの検討

    井上勝喜,原直,阿部匡伸,北条伸克,井島勇祐

    2018年日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2018年3月13日 - 2018年3月15日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学宮代キャンパス  

    researchmap

  • Sound sensing using smartphones as a crowdsourcing approach

    Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

    APSIPA Annual Summit and Conference 2017  2017年12月15日  APSIPA

     詳細を見る

    開催年月日: 2017年12月12日 - 2017年12月15日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Kuala Lumpur, Malaysia  

    researchmap

  • An investigation to transplant emotional expressions in DNN-based TTS synthesis,

    Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

    APSIPA Annual Summit and Conference 2017  2017年12月14日  APSIPA

     詳細を見る

    開催年月日: 2017年12月12日 - 2017年12月15日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Kuala Lumpur, Malaysia  

    researchmap

  • New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease,

    Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

    ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks (LocalRec 2017)  ACM

     詳細を見る

    開催年月日: 2017年11月7日 - 2017年11月10日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Redondo Beach, CA, USA  

    researchmap

  • DNN に基づく差分スペクトル補正を用いた声質変換による舌亜全摘出者の音韻明瞭性改善の検討

    村上博紀, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会2017年秋季研究発表会  2017年9月26日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • DNN による人間の感覚を考慮した騒々しさ推定方式に基づく騒音マップの作成

    小林将大, 原直, 阿部匡伸

    日本音響学会2017年秋季研究発表会  2017年9月26日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • DNN音声合成における話者と感情の情報を扱うためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2017年秋季研究発表会  2017年9月25日  日本音響学会

     詳細を見る

    開催年月日: 2017年9月25日 - 2017年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:愛媛大学 城北キャンパス  

    researchmap

  • Prediction of subjective assessments for a noise map using deep neural networks

    Shota Kobayashi, Sunao Hara, Masanobu Abe

    2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2017)  2017年9月13日  ACM

     詳細を見る

    開催年月日: 2017年9月11日 - 2017年9月15日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Maui, Hawaii, USA  

    researchmap

  • Speaker Dependent Approach for Enhancing a Glossectomy Patient's Speech via GMM-based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

    Interspeech 2017  2017年8月23日  ISCA

     詳細を見る

    開催年月日: 2017年8月20日 - 2017年8月24日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Stockholm, Sweden  

    researchmap

  • 環境音収集に効果的なインセンティブを与える可視化方式の検討

    畠山晏彩子, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2017)  2017年6月28日  情報処理学会

     詳細を見る

    開催年月日: 2017年6月28日 - 2017年6月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:定山渓万世閣ホテルミリオーネ  

    researchmap

  • DNN音声合成における感情付与のためのモデル構造の検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    音声研究会  2017年6月22日  電子情報通信学会

     詳細を見る

    開催年月日: 2017年6月22日 - 2017年6月23日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東北大学 片平キャンパス  

    researchmap

  • 2つの粒度の生活圏に基づく見守りシステム

    鎌田成紀, 原直, 阿部匡伸

    電子情報通信学会総合大会  2017年3月22日  電子情報通信学会

     詳細を見る

    開催年月日: 2017年3月22日 - 2017年3月25日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学  

    researchmap

  • スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会2017年春季研究発表会  2017年3月16日  日本音響学会

     詳細を見る

    開催年月日: 2017年3月15日 - 2017年3月17日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:明治大学生田キャンパス  

    researchmap

  • DNNによる人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

    小林将大, 原直, 阿部匡伸

    日本音響学会2017年春季研究発表会  2017年3月16日  日本音響学会

     詳細を見る

    開催年月日: 2017年3月15日 - 2017年3月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:明治大学生田キャンパス  

    researchmap

  • Enhancing a Glossectomy Patient’s Speech via GMM-based Voice Conversion

    Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

    APSIPA Annual Summit and Conference 2016  2016年12月13日  APSIPA

     詳細を見る

    開催年月日: 2016年12月13日 - 2016年12月16日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Jeju, Korea  

    researchmap

  • A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model

    Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

    ASA/ASJ 5th Joint Meeting  2016年11月29日  米国音響学会/日本音響学会

     詳細を見る

    開催年月日: 2016年11月28日 - 2016年12月2日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Honolulu, Hawaii  

    researchmap

  • 基本周波数変形を考慮したスペクトル変換手法の検討

    床建吾, 阿部匡伸, 原直

    第18回IEEE広島支部学生シンポジウム(HISS 18th)  2016年11月19日  IEEE広島支部

     詳細を見る

    開催年月日: 2016年11月19日 - 2016年11月20日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:山口大学  

    researchmap

  • スマートフォンで収録した環境音に含まれるタップ音除去方式の検討

    朝田興平, 原直, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:富山大学五福キャンパス  

    researchmap

  • 重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討

    原直, 田中智康, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山大学五福キャンパス  

    researchmap

  • GMMに基づく声質変換を用いた舌亜全摘出者の音韻明瞭性改善の検討

    田中慧, 原直, 阿部匡伸, 皆木省吾

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山大学五福キャンパス  

    researchmap

  • RNNによる実環境データからのマルチ音響イベント検出

    鳥羽隼司, 原直, 阿部匡伸

    日本音響学会2016年秋季研究発表会  2016年9月15日  日本音響学会

     詳細を見る

    開催年月日: 2016年9月14日 - 2016年9月16日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:富山大学五福キャンパス  

    researchmap

  • LiBS: Lifelog browsing system to support sharing of memories

    Atsuya Namba, Sunao Hara, Masanobu Abe

    2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016)  2016年9月13日  ACM

     詳細を見る

    開催年月日: 2016年9月12日 - 2016年9月16日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Heidelberg, Germany  

    researchmap

  • Safety vs. Privacy: User Preferences from the Monitored and Monitoring Sides of a Monitoring System

    Shigeki Kamada, Sunao Hara, Masanobu Abe

    2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016)  2016年9月13日  ACM

     詳細を見る

    開催年月日: 2016年9月12日 - 2016年9月16日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Heidelberg, Germany  

    researchmap

  • 主観的評価に基づいた騒音マップ構築のためのクラウドソーシングによる環境音収集システム

    原直, 小林将大, 阿部匡伸

    音声研究会  2016年8月25日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年8月24日 - 2016年8月25日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:京都大学  

    researchmap

  • Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation

    Sunao Hara, Shota Kobayashi, Masanobu Abe

    IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016)  2016年7月15日  IEEE

     詳細を見る

    開催年月日: 2016年7月11日 - 2016年7月15日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Seattle, WA, USA  

    researchmap

  • GPSデータ匿名化レベルの主観的許容度を客観的に表現する指標の検討

    三藤優介, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)  2016年7月7日  情報処理学会

     詳細を見る

    開催年月日: 2016年7月6日 - 2016年7月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:鳥羽シーサイドホテル  

    researchmap

  • 人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

    小林将大, 原直, 阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2016)  2016年7月6日  情報処理学会

     詳細を見る

    開催年月日: 2016年7月6日 - 2016年7月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:鳥羽シーサイドホテル  

    researchmap

  • 滞在地ネットワークに基づく滞在地間の移動傾向を表現する尺度の検討

    大藤高史, 原直, 阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会  2016年5月13日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年5月12日 - 2016年5月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京大学  

    researchmap

  • 賑わい度推定のための環境音データベースの構築

    田中智康,原直,阿部匡伸

    2016年日本音響学会春季研究発表会  2016年3月11日  日本音響学会

     詳細を見る

    開催年月日: 2016年3月9日 - 2016年3月11日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:桐蔭横浜大学  

    researchmap

  • 生活圏を応用したプライバシーに配慮可能な見守り方式の検討

    鎌田成紀,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  2016年1月21日  電子情報通信学会

     詳細を見る

    開催年月日: 2016年1月21日 - 2016年1月22日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:福岡工業大学  

    researchmap

  • A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding

    Masaki Yamaoka, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2015  2015年12月19日  APSIPA

     詳細を見る

    開催年月日: 2015年12月16日 - 2015年12月19日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Hong Kong  

    researchmap

  • 環境音検出器を用いた環境音の可視化に関する検討

    田中智康,原直,阿部匡伸

    第17回IEEE広島支部学生シンポジウム(HISS 17th)  IEEE広島支部

     詳細を見る

    開催年月日: 2015年11月21日 - 2015年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:岡山大学  

    researchmap

  • 心地よく話すことができる聞き役音声対話システムのための対話戦略

    齊藤椋太,原直,阿部匡伸

    第17回IEEE広島支部学生シンポジウム(HISS 17th)  IEEE広島支部

     詳細を見る

    開催年月日: 2015年11月21日 - 2015年11月22日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:岡山大学  

    researchmap

  • クラウドソーシングによる環境音収集システムを用いた予備収録実験

    原直,阿部匡伸,曽根原登

    2015年日本音響学会秋季研究発表会  2015年9月18日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:会津大学  

    researchmap

  • 冗長なシステム応答を用いたユーザの誤認識に頑健な音声対話システムに関する検討

    山岡将綺,原直,阿部匡伸

    2015年日本音響学会秋季研究発表会  2015年9月18日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:会津大学  

    researchmap

  • 音楽を用いた生活収録音の振り返り手法の検討

    鳥羽隼司,原直,阿部匡伸

    2015年日本音響学会秋季研究発表会  2015年9月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年9月16日 - 2015年9月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:会津大学  

    researchmap

  • A Sub-Band Text-to-Speech by Combining Sample-Based Spectrum with Statistically Generated Spectrum

    Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki and Hideyuki Mizuno

    Interspeech 2015  ISCA

     詳細を見る

    開催年月日: 2015年9月6日 - 2015年9月10日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Dresden, Germany  

    researchmap

  • Algorithm to estimate a living area based on connectivity of places with home

    Yuji Matsuo, Sunao Hara, Masanobu Abe

    HCI International 2015 

     詳細を見る

    開催年月日: 2015年8月2日 - 2015年8月7日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Los Angels, CA, USA  

    researchmap

  • Extraction of key segments from day-long sound data

    Akinori Kasai, Sunao Hara, Masanobu Abe

    HCI International 2015 

     詳細を見る

    開催年月日: 2015年8月2日 - 2015年8月7日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Los Angels, CA, USA  

    researchmap

  • LiBS:発見と気付きを可能とするライフログブラウジング方式

    難波敦也, 原直,阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2015)  2015年7月10日 

     詳細を見る

    開催年月日: 2015年7月8日 - 2015年7月10日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岩手県 安比高原  

    researchmap

  • 長期取得音からライフログとして残したい音の抽出方法

    笠井昭範,原直,阿部匡伸

    マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2015)  2015年7月10日 

     詳細を見る

    開催年月日: 2015年7月8日 - 2015年7月10日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岩手県 安比高原  

    researchmap

  • 振り返り支援における効率的な映像要約のための自動収集ライフログ活用法

    大西杏菜,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年5月14日 - 2015年5月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:津田塾大学小平キャンパス  

    researchmap

  • Sound collection and visualization system enabled participatory and opportunistic sensing approaches

    Sunao Hara, Masanobu Abe, Noboru Sonehara

    2nd International Workshop on Crowd Assisted Sensing, Pervasive Systems and Communications (CASPer 2015)  IEEE

     詳細を見る

    開催年月日: 2015年3月27日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:St. Louis, Missouri, USA  

    researchmap

  • ミックスボイスの地声・裏声との類似度比較

    家村朋典,原直,阿部匡伸

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学理工学部  

    researchmap

  • 聴取者の主観評価に基づく音地図作成のための環境音収録

    原直,阿部匡伸,曽根原登

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:日本大学理工学部  

    researchmap

  • 高域部への素片スペクトルとHMM生成スペクトルの導入によるHMM合成音声の品質改善の検討

    稻井禎,原直,阿部匡伸,井島勇祐,宮崎昇,水野秀之

    2015年日本音響学会春季研究発表会  2015年3月17日  日本音響学会

     詳細を見る

    開催年月日: 2015年3月16日 - 2015年3月18日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学理工学部  

    researchmap

  • 移動経路のパターン分類による人の行動分析

    瀬藤諒,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式

    林啓吾,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • 滞在地と経路に着目した生活圏抽出法

    松尾雄二,原直,阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会 (LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2015年3月5日 - 2015年3月6日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄科学技術大学院大学  

    researchmap

  • クラウドセンシングデータによる地域の賑わい分析 -地域経済活性化-

    原直

    第7回国際ワークショップ 「社会イノベーションを誘発する情報・システム」  国立情報学研究所

     詳細を見る

    開催年月日: 2015年2月16日 - 2015年2月17日

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:国立情報学研究所  

    researchmap

  • Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization

    Masanobu Abe, Akihiko Hirayama, Sunao Hara

    IEEE International Conference on Consumer Electronics  IEEE

     詳細を見る

    開催年月日: 2015年1月9日 - 2015年1月12日

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Las Vegas, USA  

    researchmap

  • 発話への関心の有無判別における聞き手の判別基準の有効性

    齊藤椋太, 原直, 阿部匡伸

    第17回日本音響学会関西支部 若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2014年12月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:関西大学  

    researchmap

  • ロック歌唱における「歪み声」と「ミックスボイス」の音響的特徴分析

    家村朋典,原直,阿部匡伸

    第17回日本音響学会関西支部 若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2014年12月14日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:関西大学  

    researchmap

  • A Hybrid Text-to-Speech Based on Sub-Band Approach

    Takuma Inoue, Sunao Hara, Masanobu Abe

    Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference (APSIPA ASC 2014)  Asia-Pacific Signal and Information Processing Association (APSIPA)

     詳細を見る

    開催年月日: 2014年12月9日 - 2014年12月12日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Cambodia  

    researchmap

  • 音素波形選択型音声合成方式に用いるデータベースサイズと主観評価との関係分析

    稻井禎, 原直, 阿部匡伸

    2014年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2014年9月3日 - 2014年9月5日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:北海学園大学  

    researchmap

  • クラウドセンシングにより収集された環境音のシンボル表現を用いた音地図構築手法

    原直, 阿部匡伸, 曽根原登

    2014年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2014年9月3日 - 2014年9月5日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:北海学園大学  

    researchmap

  • FLAG: 位置情報を基軸としたライフログ集約システム

    笠井昭範, 原直, 阿部匡伸

    ユビキタスコンピューティングシステム研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年6月28日 - 2014年6月29日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国立情報学研究所  

    researchmap

  • GPSデータから構築したネットワーク構造におけるノード次数に基づく行動分析法の検討

    藤岡大輔, 原直, 阿部匡伸

    ユビキタスコンピューティングシステム研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年5月29日 - 2014年5月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:富山国際会議場  

    researchmap

  • スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発

    原直,笠井昭範,阿部匡伸,曽根原登

    音声研究会(音学シンポジウム2014)  電子情報通信学会

     詳細を見る

    開催年月日: 2014年5月24日 - 2014年5月25日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本大学文理学部キャンパス 百周年記念館  

    researchmap

  • 車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

    山岡将綺, 原直, 阿部匡伸

    音声言語処理研究会  情報処理学会

     詳細を見る

    開催年月日: 2014年5月22日 - 2014年5月23日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工業大学大岡山キャンパス  

    researchmap

  • 非負値行列因子分解によるPC操作ログからの勤務パタン抽出

    平山明彦, 原直, 阿部匡伸

    ライフインテリジェンスとオフィス情報システム研究会  電子情報通信学会

     詳細を見る

    開催年月日: 2014年5月15日 - 2014年5月16日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

    researchmap

  • クラウドソーシングによる環境音収集

    原直

    第15回 岡山情報通信技術研究会  岡山情報通信技術研究会

     詳細を見る

    開催年月日: 2014年4月30日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • New Approach to Emotional Information Exchange: Experience Metaphor Based on Life Logs

    Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

    The 12th IEEE International Conference on Pervasive Computing and Communications (PerCom 2014)  IEEE

     詳細を見る

    開催年月日: 2014年3月24日 - 2014年3月28日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Budapest, Hungary  

    researchmap

  • 他人との行動ログ比較による個人の行動特徴分析

    瀬藤諒, 阿部匡伸, 原直

    電子情報通信学会2014年総合大会  電子情報通信学会

     詳細を見る

    開催年月日: 2014年3月18日 - 2014年3月21日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 滞在地と経路に着目した生活圏抽出法の検討

    松尾雄二,原直,阿部匡伸

    情報処理学会第76回全国大会  2014年 

     詳細を見る

    開催年月日: 2014年3月11日 - 2014年3月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学  

    researchmap

  • 滞在地の特徴量を利用した「特別な日」検索方式の検討

    林啓吾,原直,阿部匡伸

    情報処理学会第76回全国大会  2014年 

     詳細を見る

    開催年月日: 2014年3月11日 - 2014年3月13日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学  

    researchmap

  • 音声波形の高域利用による HMM 音声合成方式の評価

    井上拓真,原直,阿部匡伸,井島勇祐,水野秀之

    2014年日本音響学会春季研究発表会  2014年 

     詳細を見る

    開催年月日: 2014年3月10日 - 2014年3月12日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:日本大学  

    researchmap

  • クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

    原直,笠井昭範,阿部匡伸,曽根原登

    電子情報通信学会 LOIS研究会  2014年 

     詳細を見る

    開催年月日: 2014年3月7日 - 2014年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 地理情報を活用したモバイル音声対話システムに関する研究

    原直

    情報処理学会 音声言語処理研究会(SIG–SLP第100回シンポジウム) 

     詳細を見る

    開催年月日: 2014年1月31日 - 2014年2月1日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • PC操作ログから抽出したソフトウェアの使用様態による働き方の分析

    平山明彦,原直,阿部匡伸

    第15回IEEE広島支部学生シンポジウム(HISS 15th)  2013年 

     詳細を見る

    開催年月日: 2013年11月

    記述言語:日本語   会議種別:ポスター発表  

    開催地:鳥取大学  

    researchmap

  • GPSデータの滞在地に着目した行動振り返り支援方式

    林啓吾,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • GPSデータを用いた生活圏の動的生成のためのデータ量に関する検討

    松尾雄二,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 混合正規分布を用いた声質変換法における分布数とスペクトル変換精度との関係性の検討

    遠藤一輝,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 位置情報による行動分析を行うための経由地検出の検討

    瀬藤諒,原直,阿部匡伸

    平成25年度(第64回)電気・情報関連学会中国支部連合大会 

     詳細を見る

    開催年月日: 2013年10月19日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • スペクトル包絡と基本周波数の変換が音声の個人性に与える影響の検討

    河井啓介, 原直, 阿部匡伸

    2013年日本音響学会秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年9月25日 - 2013年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    開催地:豊橋技術科学大学  

    researchmap

  • 音声波形の高域利用によるHMM音声合成の高品質化

    井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

    2013年日本音響学会秋季研究発表会 

     詳細を見る

    開催年月日: 2013年9月25日 - 2013年9月27日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 音響信号とマルチセンサー信号を利用したスマートフォンによる自動車の燃費推定

    難波祥平,原直,阿部匡伸

    音声研究会  電子情報通信学会/日本音響学会

     詳細を見る

    開催年月日: 2013年5月16日 - 2013年5月17日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岡山大学  

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力棄却モデルの可搬性の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会 2013年春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年3月13日 - 2013年3月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工科大学  

    researchmap

  • HMM音声合成と波形音声合成の混在による方式の評価

    井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

    日本音響学会 2013年春季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2013年3月13日 - 2013年3月15日

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京工科大学  

    researchmap

  • GPSデータから抽出した滞在地のネットワークにおける個人の特徴分析

    藤岡大輔, 原直, 阿部匡伸

    電子情報通信学会 ライフインテリジェンスとオフィス情報システム研究会(LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2013年3月7日 - 2013年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 他者のライフログからの類似した印象を持つイベント抽出法の検討

    濱野和人, 原直, 阿部匡伸, 藤岡大輔, 望月理香, 渡部智樹

    電子情報通信学会 ライフインテリジェンスとオフィス情報システム研究会(LOIS)  電子情報通信学会

     詳細を見る

    開催年月日: 2013年3月7日 - 2013年3月8日

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Bag-of-Wordsを用いた音声情報案内システム無効入力棄却モデルの可搬性の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    第15回日本音響学会関西支部若手研究者交流研究発表会  日本音響学会関西支部

     詳細を見る

    開催年月日: 2012年12月9日

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • Development of a toolkit handling multiple speech-oriented guidance agents for mobile applications

    Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

    The 4th International Workshop on Spoken Dialog Systems (IWSDS2012) 

     詳細を見る

    開催年月日: 2012年11月28日 - 2012年11月30日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Paris, France  

    researchmap

  • Evaluation of invalid input discrimination using BOW for speech-oriented guidance system

    Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

    The 4th International Workshop on Spoken Dialog Systems (IWSDS2012) 

     詳細を見る

    開催年月日: 2012年11月28日 - 2012年11月30日

    記述言語:英語   会議種別:ポスター発表  

    開催地:Paris, France  

    researchmap

  • 音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

    真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

    日本音響学会 2012年秋季研究発表会  日本音響学会

     詳細を見る

    開催年月日: 2012年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

    原直,川波弘道,猿渡洋,鹿野清宏

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • クラウド時代の新しい音声研究パラダイム

    秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原直,堀貴明

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:シンポジウム・ワークショップ パネル(指名)  

    researchmap

  • 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

    真嶋温佳,トーレス・ラファエル,川波弘道,原直,松井知子,猿渡洋,鹿野清宏

    音声言語処理研究会  2012年  情報処理学会

     詳細を見る

    開催年月日: 2012年7月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Causal analysis of task completion erros in spoken music retrieval interactions

    Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    LREC 2012  2012年  ELDA

     詳細を見る

    開催年月日: 2012年5月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Istanbul, Turkey  

    researchmap

  • Multi-band speech recognition using band-dependent confidence measures of blind source separation

    Atsushi Ando, Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    The Acoustics 2012  2012年 

     詳細を見る

    開催年月日: 2012年5月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hong Kong  

    researchmap

  • 携帯端末用音声情報案内システムのためのマイク入力に関する調査

    中清行,原直,川波弘道,猿渡洋,鹿野清宏

    電子情報通信学会 総合大会 情報・システムソサイエティ特別企画 学生ポスターセッション  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:ポスター発表  

    researchmap

  • 周波数帯域ごとの音源分離信頼度を利用したマルチバンド音声認識

    安藤厚志,大橋宏正,原直,北岡教英,武田一哉

    2012年春季研究発表会  2012年  日本音響学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 多様な利用環境における音声情報案内サービスソフトウェアの開発

    原直,川波弘道,猿渡洋,鹿野清宏

    電子情報通信学会総合大会  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • ブラインド音源分離の信頼度を用いたマルチバンド音声認識

    安藤厚志,大橋宏正,原直,北岡教英,武田一哉

    音声研究会  2012年  電子情報通信学会

     詳細を見る

    開催年月日: 2012年2月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    ASRU 2011  2011年  IEEE

     詳細を見る

    開催年月日: 2011年12月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hawaii  

    researchmap

  • Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations

    Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

    APSIPA-ASC 2011  2011年  APSIPA

     詳細を見る

    開催年月日: 2011年10月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Xi'an, China  

    researchmap

  • On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    IWSDS 2011  2011年 

     詳細を見る

    開催年月日: 2011年9月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Granada, Spain  

    researchmap

  • Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    Interspeech 2011  2011年  ISCA

     詳細を見る

    開催年月日: 2011年8月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Florence, Italy  

    researchmap

  • Music recommendation system based on human-to-human conversation recognition

    Hiromasa OHASHI, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    HCIAmI'11  2011年 

     詳細を見る

    開催年月日: 2011年7月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Nottingham, U.K.  

    researchmap

  • 雑談音声の認識に基づく楽曲連想再生システム

    大橋宏正,原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • MLLR変換行列に基づいた音響特徴量生成による音響モデル学習

    伊藤新,原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムにおける発話・行動タグN-gram を用いた課題未達成対話の検出手法と分析

    原直,北岡教英,武田一哉

    2011年春季研究発表会  2011年  日本音響学会

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル

    伊藤新,北岡教英,原直,武田一哉

    音声言語シンポジウム  2010年  情報処理学会

     詳細を見る

    開催年月日: 2010年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 雑談音声の常時認識による楽曲提案システム

    大橋宏正,北岡教英,原直,武田一哉

    音声研究会  2010年  電子情報通信学会

     詳細を見る

    開催年月日: 2010年10月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    INTERSPEECH2010  2010年9月  ISCA

     詳細を見る

    開催年月日: 2010年9月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Makuhari, Japan  

    researchmap

  • 音声対話システムの発話系列N-gram を用いた課題未達成対話のオンライン検出

    原直,北岡教英,武田一哉

    2011年秋季研究発表会  2010年  日本音響学会

     詳細を見る

    開催年月日: 2010年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Rapid acoustic model adaptation using inverse MLLR-based feature generation

    Arata ITO, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    The 20th International Congress on Acoustics (ICA2010)  2010年8月 

     詳細を見る

    開催年月日: 2010年8月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Sydney, Australia  

    researchmap

  • Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system

    Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

    7th conference on International Language Resources and Evaluation (LREC'10)  2010年5月  ELDA

     詳細を見る

    開催年月日: 2010年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Valleta, Malta  

    researchmap

  • MLLR 変換行列により生成した音声特徴量に基づく高速モデル適応

    伊藤新,原直,北岡教英,武田一哉

    2011年秋季研究発表会  2010年  日本音響学会

     詳細を見る

    開催年月日: 2010年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 楽曲連想再生のための文書特徴量と音響特徴量の対応付け

    高橋量衛, 大石康智, 原直, 北岡教英, 武田一哉

    第4回音声ドキュメント処理ワークショップ  2010年 

     詳細を見る

    開催年月日: 2010年2月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

    原直,北岡教英,武田一哉

    音声言語シンポジウム  2009年  情報処理学会

     詳細を見る

    開催年月日: 2009年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 複数音響モデルからの最適選択による音声認識

    伊藤新,原直,宮島千代美,北岡教英,武田一哉

    平成21年度電気関係学会 東海支部連合大会  2009年 

     詳細を見る

    開催年月日: 2009年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 楽曲間の主観的類似度と音響的類似度との関連付けに関する検討

    平賀悠介,大石康智,原直,武田一哉

    2009年秋季研究発表会  2009年  日本音響学会

     詳細を見る

    開催年月日: 2009年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声対話システムのユーザ満足度推論におけるネットワークモデルの構築と評価

    原直,北岡教英,武田一哉

    2009年春季研究発表会  2009年  日本音響学会

     詳細を見る

    開催年月日: 2009年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • 音声認識システムの満足度評価におけるユーザモデル

    原直,北岡教英,武田一哉

    音声言語シンポジウム  2008年  情報処理学会

     詳細を見る

    開催年月日: 2008年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    researchmap

  • Data collection and usability study of a PC-based speech application in various user environments

    Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Oriental-COCOSDA 2008  2008年11月 

     詳細を見る

    開催年月日: 2008年11月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Kyoto, Japan  

    researchmap

  • In-car speech data collection along with various multimodal signals

    Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

    The 6th International Language Resources and Evaluation (LREC08)  2008年5月  ELDA

     詳細を見る

    開催年月日: 2008年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Marrakech Morocco  

    researchmap

  • DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 国際会議

    Hiroki Murakami, Sunao Hara, Masanobu Abe

    APSIPA Annual Summit and Conference 2019  2019年11月  APSIPA

     詳細を見る

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lanzhou, China  

    researchmap

  • 舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

    村上博紀, 荻野聖也, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

    日本音響学会2018年春季研究発表会  2018年3月26日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • クラウドソーシングによる賑わい音識別方式のフィールド実験評価

    朝田興平, 原直, 阿部匡伸

    日本音響学会2018年春季研究発表会  2018年3月25日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • DNN音声合成における感情付与のための継続時間長モデルの検討

    井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

    日本音響学会2018年春季研究発表会  2018年3月25日  日本音響学会

     詳細を見る

    記述言語:日本語   会議種別:ポスター発表  

    開催地:日本工業大学 宮代キャンパス  

    researchmap

  • An online customizable music retrieval system with a spoken dialogue interface

    Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

    4th Joint Meeting of ASA/ASJ  2006年11月 

     詳細を見る

    記述言語:英語   会議種別:ポスター発表  

    researchmap

  • Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System

    Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

    Oriental-COCOSDA 2005  2005年12月 

     詳細を見る

    記述言語:英語   会議種別:口頭発表(一般)  

    researchmap

▼全件表示

Works(作品等)

  • ChartEx

    原直

    2017年5月

     詳細を見る

    作品分類:ソフトウェア   発表場所:GitHub  

    Excel Addin for export chart as image file such as png, jpeg, and pdf.

    researchmap

  • オトログマッパー

    原 直

    2014年
    -
    2016年

     詳細を見る

    作品分類:ソフトウェア   発表場所:Google Play  

    研究用に作成した Android アプリケーション

    researchmap

  • TTX KanjiMenu Plugin

    原直

    2007年3月

     詳細を見る

    作品分類:ソフトウェア  

    Tera Termでサーバで利用する漢字コードの選択をメニューから選択できるようにするためのプラグインです。現在は、Sourceforge.jpのTera Termプロジェクトによってメンテナンスがなされています。

    researchmap

  • Pocket Julius

    原直

    2003年1月

     詳細を見る

    作品分類:ソフトウェア  

    このパッケージは大語彙音声認識デコーダ Julius を Microsoft Pocket PC 2002 環境で動くようにした Pocket Julius のデモパッケージです.

    researchmap

受賞

  • 学会活動貢献賞

    2023年3月   日本音響学会  

     詳細を見る

  • 教育貢献賞

    2022年3月   岡山大学工学部   実験・演習科目における音声配信環境の構築

    原 直, 右田 剛史

     詳細を見る

  • 教育貢献賞

    2022年3月   岡山大学工学部   教育用計算機システムの充実に関する貢献

    乃村 能成, 上野 史, 原 直, 渡邊 誠也

     詳細を見る

  • 社会貢献賞

    2021年3月   岡山大学工学部  

     詳細を見る

  • ベストティーチャー賞

    2020年3月   岡山大学工学部  

     詳細を見る

  • 教育貢献賞

    2019年3月   岡山大学工学部  

    原直

     詳細を見る

  • 学会活動貢献賞

    2019年3月   日本音響学会  

    原直

     詳細を見る

  • FIT奨励賞

    2018年9月   第17回情報科学技術フォーラム  

    原直

     詳細を見る

  • 優秀論文賞

    2016年8月   情報処理学会 DICOMO2016  

    小林将大, 原直, 阿部匡伸

     詳細を見る

  • 教育貢献賞

    2016年3月   岡山大学工学部  

    原直

     詳細を見る

  • 平成25年度岡山工学振興会科学技術賞

    2013年7月   公益財団法人岡山工学振興会  

    原直

     詳細を見る

  • 平成16年秋季研究発表会 ポスター賞

    2004年9月   日本音響学会  

    原直

     詳細を見る

▼全件表示

共同研究・競争的資金等の研究

  • コンセプト・ドリフトを考慮して環境音から観光地の雰囲気推定する機械学習方式の研究

    研究課題/領域番号:23K11335  2023年04月 - 2027年03月

    日本学術振興会  科学研究費助成事業  基盤研究(C)

    原 直

      詳細を見る

    配分額:4680000円 ( 直接経費:3600000円 、 間接経費:1080000円 )

    researchmap

  • 協調的ライブ記録が支えるアクティブラーニング@オンラインの技術研究

    研究課題/領域番号:21K12155  2021年04月 - 2024年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4030000円 ( 直接経費:3100000円 、 間接経費:930000円 )

    本研究では、アクティブラーニングをオンライン展開するために必要となる要素技術開発を行う。特に、グループワークをオンラインで実施することを想定し、学生と学生、学生と指導者、指導者と指導者の間の意思疎通を支援する技術を開発する。
    利用者に適応可能なフレキシブルなインタフェースを実現するため、話者判別法の検討を行った。特に、若年話者判別タスクに深層学習を適用し、異なる分類モデルの検証を行った。データセットには、クラウドソーシングで収集したオンライン実環境発話を使用した。
    オンラインでの意思疎通の際に、度々問題となる話者の早口の可視化手法を検討した。自動音声認識を応用して、単位時間あたりの発話文字数(発話速度)の計測を試みたが、早口の検出部分と聴講者が早口と感じるタイミングが異なることがあることを確認した。複数の自動音声認識エンジンを併用した実験では、人手で書き起こした正確な場合よりも自動音声認識の出力文字数が少なくなる傾向があった。この減少を早口の可視化のファクタとして利用することを検討した。
    音声と映像の併用特徴量を用いて、議論の様子の評価手法を検討した。音と画像を併用することで識別率の改善傾向が得られた。音響信号が取得できない場合でも、画像中の人の動きから判定できることがあることを確認した。多様な情報源から、適切な特徴量を見出す方式について、さらに検討する。
    敵対的生成ネットワークを用いた話者匿名化手法の検証を行った。匿名化処理後の音声に対し、自然性と話者認識可能性、話者弁別可能性を調査した。自然性について、従来法と比較してスコアの改善を得た。処理後音声からの話者特定は困難であることを確認した。話者弁別正解率から、処理後音声間の話者弁別は可能であることが示された。

    researchmap

  • 感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

    研究課題/領域番号:21K11963  2021年04月 - 2024年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4160000円 ( 直接経費:3200000円 、 間接経費:960000円 )

    研究計画調書に記載した課題に関して,令和3年度(2021年度)に実施した内容は下記の通り。
    (課題1)非言語情報の表現モデル 「①-1感情表現モデルの検討」 については,話者性を制御できるように補助情報として話者IDを加えるとともに,感情の強さを感情IDのone-hotベクトルの重みによって合成時に制御できるようにモデル構造を改良した。「①-2感情強度表現方式の検討」についてはMOSテストによって感情の強さ制御性能を評価した。評価実験から感情IDの操作によって,“Happy”は感情の強さを制御可能であることが示された.一方,“Angry”は感情の強さが“Happy”ほど適切に制御できなかった。分析の結果, “Angry”は“Normal”に類似した音響パラメータ特徴となっており,今回の実験に使用した“Angry”データは細かな操作が難しい音声であることが明らかとなった。「①-3話者性の多様化への適用」については, ABX テストにより合成音声の話者性を評価した。Xとして自然音声か合成音声のどちらかを提示し,XがA話者とB話者のどちらに近いかを判定させた。自然音声では,“Happy” と“Normal” では正解率が約95%,“Angry” は正解率が約85%であり,他の感情に比べて話者性の差が小さいと考えられる.これに対して合成音声はどの感情においても70%程度となり,正解率は低下するものの話者性の識別はできていると考えられる。また,“Happy”は,話者性の識別率が高く,“Angry”は,話者によっては識別率の高い話者がいた。また,話者性の識別は声質の違いと感情の表出の違いとがあり,どちらが重要な要因であるかはさらなる実験が必要である。

    researchmap

  • 観光地の雰囲気可視化を可能とする簡易なアノテーションに基づく深層学習方式の研究

    研究課題/領域番号:20K12079  2020年04月 - 2023年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    原 直

      詳細を見る

    担当区分:研究代表者 

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    課題1に関連して,これまでに収録を行っていたデータ約800個に対して,1名による詳細なアノテーション付与を行った.課題3で検討した項目に準じて付与を行った.アノテーションのための環境音聴取時には,ストリートビューの映像も同時に提示することで,音だけに依存しない場の印象や雰囲気をアノテーションすることとした.
    課題2に関連して,課題1で得られたデータを利用し,単純なDNN方式による地域特性の分類を行った.分類器には,音源情報を入れることで,地域特性の推定精度が上がる.このとき,人手でつけた音源情報ではなく,音響信号と航空写真から推定した音源情報によっても,人手の情報と同程度の推定精度が得られることを示した.これにより,詳細アノテーションに比肩する情報を,簡易アノテーションに付加情報を与えることで得られる可能性が示唆された.さらに,Concept Driftに基づく適応方式の研究を進めた.
    課題3に関連して,昨年度に引き続き,ISO12913のサウンドスケープとしての考え方に基づいた研究を進めた.地域特性を表現するアノテーションとして,8種類の評価軸を用いることとした.ただし,人手の評価によるばらつきも考慮し,8つの評価軸から,より簡潔に表現することができる2種の評価軸で表す方式を採用し,課題2における推定方式の検討を進めた.
    課題2に挙げたConcept Driftの考え方を取り入れた研究として,国際会議1件,論文誌1件の発表をおこなった.また,各課題にて挙げた内容に基づき,国内会議2件の発表をおこなった.

    researchmap

  • 音響信号から学修者の活性度を測るPBL指導支援システムの開発

    研究課題/領域番号:18K02862  2018年04月 - 2022年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4420000円 ( 直接経費:3400000円 、 間接経費:1020000円 )

    本研究では、音情報処理の技術を応用し、大学等の高等教育機関で導入が進むPBLの指導者支援システムを開発する。
    学修者の活性度抽出アルゴリズムの一部として、CNN Autoencoderによる音分類方式の検討を進めた。特に、収録環境の異なる2つのコーパスを用いた実験により、単に両者を混ぜたコーパスからモデル学習をするのではなく、Autoencoderによる特徴量抽出を介することで、より高い分類性能を持つモデルを学習できることを示した。画像と音声を含む会議データを収録し、その画像としての特徴と音声としての特徴を併用することで、会議参加者の発話意図の推定や参加姿勢の良し悪しを推定する検討を行った。
    PBLのデータ取集と協調的アノテーションの実現の取り組みとして、グループワークに取り組む学生個々の参加情報記録システムを開発した。システムでは,指導者がタブレット端末に提示された学生の顔画像をタッチ操作することで、その学生のグループワークへの参加状況を記録することが可能である。本研究では、発言や相槌の回数、グループワークに対する貢献度を記録できるインタフェースを設計した。システムで提示する顔画像は、360度全方位の撮影が可能なビデオカメラで撮影したパノラマ画像から抽出する。実験では、協力者に依頼し、実際のグループワークを撮影した。また、データの利活用を円滑にするため、音声を匿名化する声質変換システムの開発を行った。提案システムは、(a) マイクロホンアレイを用いた対話音声の収録 (b) 各話者の音声に含まれる特徴量の抽出 (c) 深層学習による音声の声質変換を実現する。(c)では、ニューラルネットワークに基づいた敵対的生成ネットワークのアルゴリズムであるCycle-Consistent Adversarial Networksを用いた。

    researchmap

  • ディープニューラルネットワークによる舌亜全摘出者の音韻明瞭性改善の研究

    研究課題/領域番号:18K11376  2018年04月 - 2022年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直, 皆木 省吾

      詳細を見る

    担当区分:研究分担者 

    配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )

    研究計画調書に記載した課題に関して,令和元年度(2019年度)に実施した内容は下記の通り.
    (課題1)音韻明瞭度の改善 「①-1 調音結合の制約をDNNによりモデル化」については,両方向LSTMと前向きLSTMの性能を比較した結果,両方向は明瞭性よりは自然性,高品質化の効果が大きいことが明らかになった。「①-2唇情報表現の検討」については,音声のスペクトル情報と唇の画像情報の異なる特徴量を扱うことからDNNによる方式で検討を進めた。まず, Kinectにより取得した唇の輪郭とスペクトル情報を利用した結果,母音の明瞭性が向上することが明らかとなった。子音に比べて母音の継続時間長が長いためと考えられる。次に,DNNの特徴を利用して,音韻の情報を補助的に利用する方法を検討した。実験では,正解となる音韻情報を与えて改善の可能性を確認した結果,破裂音,摩擦音等の子音の明瞭性が向上することが明らかとなった。
    (課題2)患者の発話負担軽減.「②-2疑似舌亜全摘出者音声データベースの構築」については,昨年度作成した下歯を覆うプレートを利用して,3名分の疑似舌亜全摘出者の音声と唇映像の同時収録データベースを構築した.
    (課題3)リアルタイム動作.「③-2差分スペクトル利用による誤分析対処」については,WORLD方式によって分析し,3層のDNNによるスペクトル推定し,残差信号を利用した声質変換方式により,100ミリ秒の遅れてリアルタイム処理できることが明らかとなった。

    researchmap

  • 地域活性化政策立案のための音響信号による“賑い度”調査プラットフォームの研究開発

    2015年07月 - 2018年03月

    総務省  戦略的情報通信研究開発推進事業 SCOPE(地域ICT振興型研究開発) 

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    researchmap

  • PBLの個人評価を目的とする活動音の可視化技術

    研究課題/領域番号:15K01069  2015年04月 - 2018年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    西村 竜一, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4680000円 ( 直接経費:3600000円 、 間接経費:1080000円 )

    本研究では、PBL(Project-Based Learning; プロジェクト型学習)に参加する学修者の評価を支援する手法を音情報の可視化を通じて実現するための技術開発を行った。対話音声を用いたグループワークにおけるアクティビティの自動検出法を検討した。その結果を応用し、ウェアラブル音声収録端末を用いたグループワーク状況提示システムを試作した。加えて、深層学習型ニューラルネットワークに基づく音源情報可視化手法を検討した。

    researchmap

  • ライフログに基づくプライバシーを考慮した高度な見守りシステムの研究

    研究課題/領域番号:15K00128  2015年04月 - 2018年03月

    日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

    阿部 匡伸, 原 直

      詳細を見る

    担当区分:研究分担者 

    配分額:4420000円 ( 直接経費:3400000円 、 間接経費:1020000円 )

    少子高齢化社会への移行に伴い見守りシステムの必要性が高まっている。本研究では、プライバシーを考慮できる見守りシステムを検討した。特徴は、①長期間に渡って蓄積したGPSデータからユーザの生活圏を自動推定し、②生活圏を量子化(GeoHex)表現することでプライバシ制御を可能とし、③見守る量子化レベルをユーザの行動に基づいて適応的に変更できる点にある。生活圏の推定アルゴリズムはF値0.85程度の性能を得た。また、見守る側と見守られる側での量子化レベルの好みの実験を行い、見守られる側ではユーザ依存性が大きいことを明らかにした。

    researchmap

  • 自動車運転状況の自動推定に基づく安全性に配慮した音声対話システムの研究

    研究課題/領域番号:26730092  2014年04月 - 2017年03月

    日本学術振興会  科学研究費助成事業 若手研究(B)  若手研究(B)

    原 直

      詳細を見る

    担当区分:研究代表者 

    配分額:3640000円 ( 直接経費:2800000円 、 間接経費:840000円 )

    以下を実施した.
    (1)運転者の体や車両本体にとりつけたセンサから得られる生体信号や運転情報信号を用いて運転負荷の推定.スマートフォンで得られるセンサの利用を想定した運転負荷推定.(2)ユーザ負荷の観点で運転中の利用に適した対話戦略を評価.対話の主導権の方式と確認発話の方式を組み合わせた客観評価.(3)対話システムとして評価するための主観評価.特に,運転を模擬した動作と音声対話システムの利用という二重タスク課題における主観評価.(4)ユーザ負荷の推定結果を組み込める柔軟な対話戦略の選択方式を実装.グラフ探索に基づく対話戦略を導入.客観評価実験と主観評価実験による性能評価.

    researchmap

▼全件表示

 

担当授業科目

  • パターン情報学特別演習 (2024年度) 通年  - その他

  • プログラミング演習1 (2024年度) 第1学期  - 水1~3

  • プログラミング演習2 (2024年度) 第2学期  - 水1~3

  • プログラミング演習1 (2024年度) 第1学期  - 水1~3

  • プログラミング演習2 (2024年度) 第2学期  - 水1~3

  • ヘルスシステム統合科学アドバンストインターンシップ (2024年度) 通年  - その他

  • ヘルスシステム統合科学専門英語 (2024年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2024年度) 通年  - その他

  • ヘルスシステム統合科学特別研究 (2024年度) 通年  - その他

  • マルチモーダル情報処理特論 (2024年度) 前期  - その他

  • 情報処理入門2(情報機器の操作を含む) (2024年度) 第2学期  - 月1~2

  • 情報処理入門2(情報機器の操作を含む) (2024年度) 第2学期  - 木1~2

  • 情報工学実験B (メディア処理) (2024年度) 第3学期  - 火3~7,金3~7

  • 情報工学実験B(メディア処理) (2024年度) 第3学期  - 火3~7,金3~7

  • 技術英語 (2024年度) 後期  - その他

  • 技術英語 (情報系) (2024年度) 後期  - その他

  • 特別研究 (2024年度) その他  - その他

  • 表現技法1(情報系) (2024年度) 前期  - その他

  • 表現技法2(情報系) (2024年度) 後期  - その他

  • 表現技法1 (2024年度) 前期  - その他

  • 表現技法2 (2024年度) 後期  - その他

  • 音声情報処理特論Ⅰ (2024年度) 前期  - 月1~2

  • 音声情報処理特論Ⅱ (2024年度) 前期  - 木5~6

  • 音声音響インタフェース論 (2024年度) 後期  - 水1~2

  • プログラミング演習1 (2023年度) 第1学期  - 水1~3

  • プログラミング演習2 (2023年度) 第2学期  - 水1~3

  • プログラミング演習1 (2023年度) 第1学期  - 水1~3

  • プログラミング演習2 (2023年度) 第2学期  - 水1~3

  • ヘルスシステム統合科学アドバンストインターンシップ (2023年度) 通年  - その他

  • ヘルスシステム統合科学専門英語 (2023年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2023年度) 通年  - その他

  • ヘルスシステム統合科学特別研究 (2023年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2023年度) 第2学期  - 月1~2

  • 情報処理入門2(情報機器の操作を含む) (2023年度) 第2学期  - 木1~2

  • 情報工学実験B (メディア処理) (2023年度) 第3学期  - 火3~7,金3~7

  • 情報工学実験B(メディア処理) (2023年度) 第3学期  - 火3~7,金3~7

  • 音声情報処理特論Ⅰ (2023年度) 前期  - 月1~2

  • 音声情報処理特論Ⅱ (2023年度) 前期  - 木5~6

  • ディジタル信号処理 (2022年度) 第3学期  - 火1~2,木1~2

  • プログラミング演習1 (2022年度) 第1学期  - 水1~3

  • プログラミング演習2 (2022年度) 第2学期  - 水1~3

  • プログラミング演習1 (2022年度) 第1学期  - 水1~3

  • プログラミング演習2 (2022年度) 第2学期  - 水1~3

  • ヘルスシステム統合科学専門英語 (2022年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2022年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2022年度) 第2学期  - 木1~2

  • 情報処理入門2(情報機器の操作を含む) (2022年度) 第2学期  - 月1~2

  • 情報工学実験B (メディア処理) (2022年度) 第3学期  - 火3~7,木3~7

  • 音声情報処理特論Ⅰ (2022年度) 前期  - 月1~2

  • 音声情報処理特論Ⅱ (2022年度) 前期  - 木5~6

  • ディジタル信号処理 (2021年度) 第4学期  - 月1,月2,木1,木2

  • プログラミング演習1 (2021年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2021年度) 第2学期  - 水1,水2,水3

  • ヘルスシステム統合科学専門英語 (2021年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2021年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 月1~2

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 木1~2

  • 情報工学実験B (メディア処理) (2021年度) 第3学期  - 火3,火4,火5,火6,火7,木3,木4,木5,木6,木7

  • 音声情報処理特論Ⅰ (2021年度) 前期  - 木5~6

  • 音声情報処理特論Ⅱ (2021年度) 前期  - 木5~6

  • プログラミング演習 (2020年度) 1・2学期  - 水1,水2,水3

  • プログラミング演習1 (2020年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2020年度) 第2学期  - 水1,水2,水3

  • ヘルスシステム統合科学専門英語 (2020年度) 後期  - その他

  • ヘルスシステム統合科学特別研究 (2020年度) 通年  - その他

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 月1,月2

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 木1,木2

  • 情報工学実験B (メディア処理) (2020年度) 第3学期  - 火3,火4,火5,火6,木3,木4,木5,木6

  • 情報工学実験第三 (2020年度) 第3学期  - 火3,火4,火5,火6

  • 情報工学実験第四 (2020年度) 第3学期  - 木3,木4,木5,木6

  • 音声情報処理特論Ⅰ (2020年度) 前期  - 木5,木6

▼全件表示

 

学術貢献活動

  • 日本音響学会第24回関西支部若手研究者交流研究発表会

    役割:企画立案・運営等

    日本音響学会関西支部  ( オンライン(Gather.Town) ) 2021年12月4日

     詳細を見る

    種別:学会・研究会等 

    日本音響学会関西支部では,若手研究者間での研究交流及び相互啓発を目的として,1998年より「若手研究者交流研究発表会」を開催しています。これまでに数多くの若手研究者の方々に参加・発表していただきました。本年度は,新型コロナウイルス感染症に対する各種イベントへの社会的要請等を鑑み,オンラインで開催します。研究者間の交流だけでなく産学の交流も深めるために,賛助会員の企業展示も開催する予定です。

    researchmap