研究者詳細 - 原　直

写真a

ハラ　スナオ

原　直

HARA Sunao

所属

環境生命自然科学学域准教授

ホームページ

http://www.a.cs.okayama-u.ac.jp/~hara/

プロフィール

2003年名古屋大学工学部電気電子情報工学科卒業．
2005年名古屋大学大学院情報科学研究科博士前期課程修了．
2011年同大学大学院情報科学研究科博士後期課程修了．
同年から2012年奈良先端科学技術大学院大学情報科学研究科助教．
2012年岡山大学大学院自然科学研究科助教，
2019年岡山大学大学院ヘルスシステム統合科学研究科助教，
2021年同大学学術研究院ヘルスシステム統合科学学域助教，
2024年同大学学術研究院環境生命自然科学学域准教授，現在に至る．
音声認識，音声合成，音声対話，ライフログに関する研究に従事．
2004年日本音響学会ポスター賞，2016年DICOMO2016優秀論文賞，2018年FIT奨励賞受賞．
IEEE，日本音響学会，電子情報通信学会，情報処理学会，ヒューマンインタフェース学会各会員．

外部リンク

学位

博士（情報科学）（名古屋大学大学院情報科学研究科）

研究キーワード

ヒューマンインタフェース
音声対話
音声認識
ライフログ
音響シーン分析
音響イベント検出
深層学習
機械学習
音声情報処理
音声対話システム

研究分野

情報通信 / 知能情報学
情報通信 / ウェブ情報学、サービス情報学
情報通信 / 知覚情報処理

経歴

岡山大学学術研究院環境生命自然科学学域准教授

2024年4月 - 現在

　詳細を見る

researchmap
岡山大学大学院ヘルスシステム統合科学研究科助教

2019年4月 - 2024年4月

　詳細を見る

国名：日本国

researchmap
岡山大学大学院自然科学研究科助教

2012年9月 - 2019年3月

　詳細を見る

国名：日本国

researchmap
奈良先端科学技術大学院大学助教

2011年11月 - 2012年9月

　詳細を見る

researchmap

所属学協会

IEEE

2016年6月 - 現在

　詳細を見る

researchmap
電子情報通信学会

2012年2月 - 現在

　詳細を見る

researchmap
情報処理学会

2007年 - 現在

　詳細を見る

researchmap
日本音響学会

2004年 - 現在

　詳細を見る

researchmap
ヒューマンインタフェース学会

2005年 - 2022年12月

　詳細を見る

researchmap

委員歴

日本音響学会編集委員会会誌部会委員

2023年6月 - 現在

　詳細を見る

団体区分：学協会

researchmap
日本音響学会関西支部第24回若手研究者交流研究発表会実行委員長

2021年4月 - 2022年3月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会広報・電子化委員会委員

2013年10月 - 現在

　詳細を見る

団体区分：学協会

電子化・広報推進委員会

researchmap
日本音響学会研究発表会準備委員会委員

2023年6月 - 現在

　詳細を見る

団体区分：学協会

researchmap
日本音響学会 2023年春季研究発表会遠隔開催実行委員会委員

2022年12月 - 2023年3月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会 2022年春季研究発表会遠隔開催実行委員会委員

2021年10月 - 2022年3月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会 2021年秋季研究発表会遠隔開催実行委員会委員

2021年7月 - 2022年3月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会 2021年春季研究発表会遠隔開催実行委員会委員

2020年11月 - 2021年3月

　詳細を見る

researchmap
日本音響学会 2020年秋季研究発表会遠隔開催実行委員会委員

2020年7月 - 2020年9月

　詳細を見る

団体区分：学協会

researchmap
電子情報通信学会ソサイエティ論文誌編集委員会査読委員

2017年8月 - 現在

　詳細を見る

団体区分：学協会

researchmap
情報処理学会中国支部支部運営委員会委員

2015年5月 - 2019年5月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会編集委員会査読委員

2014年2月 - 現在

　詳細を見る

団体区分：学協会

researchmap
日本音響学会関西支部若手研究者交流研究発表会実行委員

2011年11月 - 2022年3月

　詳細を見る

団体区分：学協会

researchmap
日本音響学会学生・若手フォーラム幹事会

2007年3月 - 2012年3月

　詳細を見る

団体区分：学協会

researchmap

▼全件表示

論文

Speech Synthesis Using Ambiguous Inputs From Wearable Keyboards 査読国際誌

Matsuri Iwasaki, Sunao Hara, Masanobu Abe

2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) 1172 - 1178 2023年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

This paper proposes a new application in speech communication using text-to-speech (TTS), and the goal is to enable dysarthria, articulation disorder, or persons who have difficulty in speaking to communicate anywhere and anytime using speech to express their thoughts and feelings. To achieve this goal, an input method is required. Thus, we propose a new text-entry method based on three concepts. First, from an easy-to-carry perspective, we used a wearable keyboard that inputs digits from 0 to 9 in decimal notation according to 10-finger movements. Second, from a no-training perspective, users input sentences in a way of touch typing using the wearable keyboard. Following this method, we obtained a sequence of numbers corresponding to the sentence. Third, a neural machine translation (NMT) method is applied to estimate texts from the sequence of numbers. The NMT was trained using two datasets; one is a Japanese-English parallel corpus containing 2.8 million pairs of sentences, which were extracted from TV and movie subtitles, while the other is a Japanese text dataset containing 32 million sentences, which were extracted from a question-and-answer platform. Using the model, phonemes and accent symbols were estimated from a sequence of numbers. Thus, the result accuracy in symbol levels was 91.48% and 43.45% of all the sentences were completely estimated with no errors. To subjectively evaluate feasibility of the NMT model, a two-person word association game was conducted; one gave hints using synthesized speech that is generated from symbols estimated by NMT, while the other guessed answers. As a result, 67.95% of all the quizzes were correctly answered, and experiment results show that the proposed method has the potential for dysarthria to communicate with TTS using a wearable keyboard.

DOI： 10.1109/APSIPAASC58517.2023.10317228

Scopus

researchmap
Speech-Emotion Control for Text-to-Speech in Spoken Dialogue Systems Using Voice Conversion and x-vector Embedding 査読国際誌

Shunichi Kohara, Masanobu Abe, Sunao Hara

2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) 2280 - 2286 2023年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

In this paper, we propose an algorithm to control both speaker individuality and emotional expressions in synthesized speech, where the most important feature is the controllability of intensity in emotional expressions. An aim of the proposed algorithm is to generate various responses including emotions in text-to-speech (TTS) for spoken dialogue systems (SDS), which results in making the system more human-like. An idea is to control emotion and its intensity in line with the user's utterances. For example, when a user happily talks to SDS, the agent of the SDS responses with happy voice. Generally, voice quality of a user and the agent are different. Therefore, the proposed algorithm consists of two steps: (1) voice conversion to change speaker individuality including emotional expressions and (2) TTS with x-vector acting as an embedding vector to mainly control speech quality related to the intensity of emotions. Evaluation experiments are carried out using a scenario of a spoken dialogue system, where a teacher system of TTS encourages or cheers up students according to students' utterances. The experiment results showed that TTS can successfully reproduce the emotion and its intensity that are extracted from students' utterances, while maintaining the teacher's speaker individuality.

DOI： 10.1109/APSIPAASC58517.2023.10317413

Scopus

researchmap
Sound map of urban areas recorded by smart devices: case study at Okayama and Kurashiki 招待

Sunao Hara, Masanobu Abe

Proceedings of the 52nd International Congress and Exposition on Noise Control Engineering (Inter-Noise 2023) 1 - 12 2023年8月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Predictions for sound events and soundscape impressions from environmental sound using deep neural networks 招待

Sunao Hara, Masanobu Abe

Proceedings of the 52nd International Congress and Exposition on Noise Control Engineering (Inter-Noise 2023) 1 - 12 2023年8月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Prediction method of Soundscape Impressions using Environmental Sounds and Aerial Photographs 査読国際誌

Yusuke Ono, Sunao Hara, Masanobu Abe

2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) 1222 - 1227 2022年11月

　詳細を見る

担当区分：責任著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.23919/apsipaasc55919.2022.9980290

researchmap

その他リンク： https://arxiv.org/abs/2209.04077
Incremental Audio Scene Classifier Using Rehearsal-Based Strategy 査読国際誌

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

2022 IEEE 10th Global Conference on Consumer Electronics (GCCE) 69 - 623 2022年10月

　詳細を見る

担当区分：最終著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

researchmap
Speech-Like Emotional Sound Generation Using WaveNet 査読

Kento Matsumoto, Sunao Hara, Masanobu Abe

IEICE Transactions on Information and Systems E105.D ( 9 ) 1581 - 1589 2022年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Institute of Electronics, Information and Communications Engineers (IEICE)

In this paper, we propose a new algorithm to generate Speech-like Emotional Sound (SES). Emotional expressions may be the most important factor in human communication, and speech is one of the most useful means of expressing emotions. Although speech generally conveys both emotional and linguistic information, we have undertaken the challenge of generating sounds that convey emotional information alone. We call the generated sounds "speech-like," because the sounds do not contain any linguistic information. SES can provide another way to generate emotional response in human-computer interaction systems. To generate "speech-like" sound, we propose employing WaveNet as a sound generator conditioned only by emotional IDs. This concept is quite different from the WaveNet Vocoder, which synthesizes speech using spectrum information as an auxiliary feature. The biggest advantage of our approach is that it reduces the amount of emotional speech data necessary for training by focusing on non-linguistic information. The proposed algorithm consists of two steps. In the first step, to generate a variety of spectrum patterns that resemble human speech as closely as possible, WaveNet is trained with auxiliary mel-spectrum parameters and Emotion ID using a large amount of neutral speech. In the second step, to generate emotional expressions, WaveNet is retrained with auxiliary Emotion ID only using a small amount of emotional speech. Experimental results reveal the following: (1) the two-step training is necessary to generate the SES with high quality, and (2) it is important that the training use a large neutral speech database and spectrum information in the first step to improve the emotional expression and naturalness of SES.

DOI： 10.1587/transinf.2021edp7236

Web of Science

researchmap

その他リンク： https://www.webofscience.com/wos/woscc/full-record/WOS:000852731400008
Concept drift adaptation for audio scene classification using high-level features 査読国際誌

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

2022 IEEE International Conference on Consumer Electronics (ICCE) 2022年1月

　詳細を見る

担当区分：最終著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/icce53296.2022.9730332

researchmap
Acoustic Scene Classifier Based on Gaussian Mixture Model in the Concept Drift Situation 査読国際誌

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

Advances in Science, Technology and Engineering Systems Journal 6 ( 5 ) 167 - 176 2021年9月

　詳細を見る

担当区分：最終著者記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：ASTES Journal

DOI： 10.25046/aj060519

researchmap
Phonetic and Prosodic Information Estimation from Texts for Genuine Japanese End-to-End Text-to-Speech 査読国際誌

Naoto Kakegawa, Sunao Hara, Masanobu Abe, Yusuke Ijima

Interspeech 2021 126 - 130 2021年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

The biggest obstacle to develop end-to-end Japanese text-to-speech (TTS) systems is to estimate phonetic and prosodic information (PPI) from Japanese texts. The following are the reasons: (1) the Kanji characters of the Japanese writing system have multiple corresponding pronunciations, (2) there is no separation mark between words, and (3) an accent nucleus must be assigned at appropriate positions. In this paper, we propose to solve the problems by neural machine translation (NMT) on the basis of encoder-decoder models, and compare NMT models of recurrent neural networks and the Transformer architecture. The proposed model handles texts on token (character) basis, although conventional systems handle them on word basis. To ensure the potential of the proposed approach, NMT models are trained using pairs of sentences and their PPIs that are generated by a conventional Japanese TTS system from 5 million sentences. Evaluation experiments were performed using PPIs that are manually annotated for 5,142 sentences. The experimental results showed that the Transformer architecture has the best performance, with 98.0% accuracy for phonetic information estimation and 95.0% accuracy for PPI estimation. Judging from the results, NMT models are promising toward end-to-end Japanese TTS.

DOI： 10.21437/interspeech.2021-914

Web of Science

researchmap
Model architectures to extrapolate emotional expressions in DNN-based text-to-speech 査読国際誌

Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

Speech Communication 126 35 - 43 2021年2月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Elsevier BV

This paper proposes architectures that facilitate the extrapolation of emotional expressions in deep neural network (DNN)-based text-to-speech (TTS). In this study, the meaning of “extrapolate emotional expressions” is to borrow emotional expressions from others, and the collection of emotional speech uttered by target speakers is unnecessary. Although a DNN has potential power to construct DNN-based TTS with emotional expressions and some DNN-based TTS systems have demonstrated satisfactory performances in the expression of the diversity of human speech, it is necessary and troublesome to collect emotional speech uttered by target speakers. To solve this issue, we propose architectures to separately train the speaker feature and the emotional feature and to synthesize speech with any combined quality of speakers and emotions. The architectures are parallel model (PM), serial model (SM), auxiliary input model (AIM), and hybrid models (PM&AIM and SM&AIM). These models are trained through emotional speech uttered by few speakers and neutral speech uttered by many speakers. Objective evaluations demonstrate that the performances in the open-emotion test provide insufficient information. They make a comparison with those in the closed-emotion test, but each speaker has their own manner of expressing emotion. However, subjective evaluation results indicate that the proposed models could convey emotional information to some extent. Notably, the PM can correctly convey sad and joyful emotions at a rate of 60%.

DOI： 10.1016/j.specom.2020.11.004

Web of Science

researchmap

その他リンク： https://arxiv.org/abs/2102.10345
Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 査読国際誌

Katsuki Inoue, Sunao Hara, Masanobu Abe

Proceedings of APSIPA Annual Summit and Conference (APSIPA-ASC 2020) 826 - 830 2020年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE/APSIPA

End-to-end text-to-speech (TTS) models have achieved remarkable results in recent times. However, the model requires a large amount of text and audio data for training. A speaker adaptation method based on fine-tuning has been proposed for constructing a TTS model using small scale data. Although these methods can replicate the target speaker s voice quality, synthesized speech includes the deletion and/or repetition of speech. The goal of speaker adaptation is to change the voice quality to match the target speaker ' s on the premise that adjusting the necessary modules will reduce the amount of data to be fine-tuned. In this paper, we clarify the role of each module in the Transformer-TTS process by not updating it. Specifically, we froze character embedding, encoder, layer predicting stop token, and loss function for estimating sentence ending. The experimental results showed the following: (1) fine-tuning the character embedding did not result in an improvement in the deletion and/or repetition of speech, (2) speech deletion increases if the encoder is not fine-tuned, (3) speech deletion was suppressed when the layer predicting stop token is not fine-tuned, and (4) there are frequent speech repetitions at sentence end when the loss function estimating sentence ending is omitted.

Web of Science

researchmap
Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 査読

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

Proceedings of IEEE REGION 10 CONFERENCE (TENCON 2020) 450 - 455 2020年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/tencon50793.2020.9293766

researchmap
Controlling the Strength of Emotions in Speech-Like Emotional Sound Generated by WaveNet 査読国際誌

Kento Matsumoto, Sunao Hara, Masanobu Abe

Proceedings of Interspeech 2020 3421 - 3425 2020年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/interspeech.2020-2064

researchmap

その他リンク： https://www.webofscience.com/wos/woscc/full-record/WOS:000833594103112
Semi-Supervised Speaker Adaptation for End-to-End Speech Synthesis with Pretrained Models 査読国際共著国際誌

Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2020) 7634 - 7638 2020年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

Recently, end-to-end text-to-speech (TTS) models have achieved a remarkable performance, however, requiring a large amount of paired text and speech data for training. On the other hand, we can easily collect unpaired dozen minutes of speech recordings for a target speaker without corresponding text data. To make use of such accessible data, the proposed method leverages the recent great success of state-of-the-art end-to-end automatic speech recognition (ASR) systems and obtains corresponding transcriptions from pretrained ASR models. Although these models could only provide text output instead of intermediate linguistic features like phonemes, end-to-end TTS can be well trained with such raw text data directly. Thus, the proposed method can greatly simplify a speaker adaptation pipeline by consistently employing end-to-end ASR/TTS ecosystems. The experimental results show that our proposed method achieved comparable performance to a paired data adaptation method in terms of subjective speaker similarity and objective cepstral distance measures.

DOI： 10.1109/icassp40776.2020.9053371

Web of Science

researchmap
DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 査読国際誌

Hiroki Murakami, Sunao Hara, Masanobu Abe

Proceedings of APSIPA Annual Summit and Conference 2019 138 - 142 2019年11月

　詳細を見る

担当区分：責任著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC47483.2019.9023168

Web of Science

researchmap
Speech-like Emotional Sound Generator by WaveNet 査読国際誌

Kento Matsumoto, Sunao Hara, Masanobu Abe

Proceedings of APSIPA Annual Summit and Conference 2019 143 - 147 2019年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1109/APSIPAASC47483.2019.9023346

Web of Science

researchmap
A signal processing perspective on human gait: Decoupling walking oscillations and gestures 査読国際誌

Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

Proceedings of the 4th International Conference on Interactive Collaborative Robotics 2019 (ICR 2019) 11659 75 - 85 2019年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： 10.1007/978-3-030-26118-4_8

Web of Science

researchmap
Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient's Speech Using Spectral Differential Modification in Voice Conversion. 査読国際誌

Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

Interspeech 2018, 19th Annual Conference of the International Speech Communication Association, Hyderabad, India, 2-6 September 2018. 2464 - 2468 2018年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/Interspeech.2018-1239

Web of Science

researchmap
Sound sensing using smartphones as a crowdsourcing approach. 査読国際誌

Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017 1328 - 1333 2017年12月

　詳細を見る

担当区分：筆頭著者,　責任著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPA.2017.8282238

Web of Science

researchmap
An investigation to transplant emotional expressions in DNN-based TTS synthesis. 査読国際誌

Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017, Kuala Lumpur, Malaysia, December 12-15, 2017 1253 - 1258 2017年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/APSIPA.2017.8282231

Web of Science

researchmap
New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease. 査読国際誌

Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

Proceedings of the 1st ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks, LocalRec@SIGSPATIAL 2017, Redondo Beach, CA, USA, November 7-10, 2017 1:1 - 1:7 2017年11月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3148150.3148151

researchmap

その他リンク： http://doi.acm.org/10.1145/3148150.3148151
Prediction of subjective assessments for a noise map using deep neural networks. 査読国際誌

Shota Kobayashi, Masanobu Abe, Sunao Hara

Adjunct Proceedings of the 2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2017 ACM International Symposium on Wearable Computers, UbiComp/ISWC 2017, Maui, HI, USA, September 11-15, 2017 113 - 116 2017年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ACM

DOI： 10.1145/3123024.3123091

Web of Science

researchmap

その他リンク： http://doi.acm.org/10.1145/3123024.3123091
Speaker Dependent Approach for Enhancing a Glossectomy Patient’s Speech via GMM-Based Voice Conversion

Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

Interspeech 2017 2017年8月

　詳細を見る

掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

DOI： 10.21437/interspeech.2017-841

Web of Science

researchmap
Speaker Dependent Approach for Enhancing a Glossectomy Patient's Speech via GMM-based Voice Conversion

Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

18TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2017), VOLS 1-6 3384 - 3388 2017年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA-INT SPEECH COMMUNICATION ASSOC

In this paper, using GMM-based voice conversion algorithm, we propose to generate speaker-dependent mapping functions to improve the intelligibility of speech uttered by patients with a wide glossectomy. The speaker-dependent approach enables to generate the mapping functions that reconstruct missing spectrum features of speech uttered by a patient without having influences of a speaker's factor. The proposed idea is simple, i.e., to collect speech uttered by a patient before and after the glossectomy, but in practice it is hard to ask patients to utter speech just for developing algorithms. To confirm the performance of the proposed approach, in this paper, in order to simulate glossectomy patients, we fabricated an intraoral appliance which covers lower dental arch and tongue surface to restrain tongue movements. In terms of the Mel-frequency cepstrum (MFC) distance, by applying the voice conversion, the distances were reduced by 25% and 42% for speaker dependent case and speaker-independent case, respectively. In terms of phoneme intelligibility, dictation tests revealed that speech reconstructed by speaker-dependent approach almost always showed better performance than the original speech uttered by simulated patients, while speaker-independent approach did not.

DOI： 10.21437/Interspeech.2017-841

Web of Science

researchmap
Enhancing a glossectomy patient's speech via GMM-based voice conversion 査読国際誌

Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

2016 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA) 1 - 4 2016年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

DOI： 10.1109/apsipa.2016.7820909

Web of Science

researchmap
LiBS: Lifelog browsing system to support sharing of memories 査読国際誌

Atsuya Namba, Sunao Hara, Masanobu Abe

UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing 165 - 168 2016年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computing Machinery, Inc

We propose a lifelog browsing system through which users can share memories of their experiences with other users. Most importantly, by using global positioning system data and time stamps, the system simultaneously displays a variety of log information in a time-synchronous manner. This function empowers users with not only an easy interpretation of other users' experiences but also nonverbal notifications. Shared information on this system includes photographs taken by users, Google street views, shops and restaurants on the map, daily weather, and other items relevant to users' interests. In evaluation experiments, users preferred the proposed system to conventional photograph albums and maps for explaining and sharing their experiences. Moreover, through displayed information, the listeners found out their interest items that had not been mentioned by the speakers.

DOI： 10.1145/2968219.2971401

Scopus

researchmap

その他リンク： http://doi.acm.org/10.1145/2968219.2971401
Safety vs. Privacy: User preferences from the monitored and monitoring sides of a monitoring system 査読国際誌

Shigeki Kamada, Sunao Hara, Masanobu Abe

UbiComp 2016 Adjunct - Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing 101 - 104 2016年9月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：Association for Computing Machinery, Inc

In this study, in order to develop a monitoring system that takes into account privacy issues, we investigated user preferences in terms of the monitoring and privacy protec-tion levels. The people on the monitoring side wanted the monitoring system to allow them to monitor in detail. Con-versely, it was observed for the people being monitored that the more detailed the monitoring, the greater the feelings of being surveilled intrusively. Evaluation experiments were performed using the location data of three people in differ-ent living areas. The results of the experiments show that it is possible to control the levels of monitoring and privacy protection without being affected by the shape of a living area by adjusting the quantization level of location informa-tion. Furthermore, it became clear that the granularity of location information satisfying the people on the monitored side and the monitoring side is different.

DOI： 10.1145/2968219.2971412

Scopus

researchmap

その他リンク： http://doi.acm.org/10.1145/2968219.2971412
Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation 査読国際誌

Sunao Hara, Shota Kobayashi, Masanobu Abe

IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016) 1 - 6 2016年

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

This paper presents a sound collection system that uses crowdsourcing to gather information for visualizing area characteristics. First, we developed a sound collection system to simultaneously collect physical sounds, their statistics, and subjective evaluations. We then conducted a sound collection experiment using the developed system on 14 participants. We collected 693,582 samples of equivalent Aweighted loudness levels and their locations, and 5,935 samples of sounds and their locations. The data also include subjective evaluations by the participants. In addition, we analyzed the changes in sound properties of some areas before and after the opening of a large-scale shopping mall in a city. Next, we implemented visualizations on the server system to attract users' interests. Finally, we published the system, which can receive sounds from any Android smartphone user. The sound data were continuously collected and achieved a specified result.

DOI： 10.1109/ICMEW.2016.7574694

Web of Science

researchmap
A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding 査読国際誌

Masaki Yamaoka, Sunao Hara, Masanobu Abe

Proceedings of APSIPA Annual Summit and Conference 2015 229 - 232 2015年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

We propose a spoken dialog strategy for car navigation systems to facilitate safe driving. To drive safely, drivers need to concentrate on their driving; however, their concentration may be disrupted due to disagreement with their spoken dialog system. Therefore, we need to solve the problems of user misunderstandings as well as misunderstanding of spoken dialog systems. For this purpose, we introduced a driver workload level in spoken dialog management in order to prevent user misunderstandings. A key strategy of the dialog management is to make speech redundant if the driver's workload is too high in assuming that the user probably misunderstand the system utterance under such a condition. An experiment was conducted to compare performances of the proposed method and a conventional method using a user simulator. The simulator is developed under the assumption of two types of drivers: an experienced driver model and a novice driver model. Experimental results showed that the proposed strategies achieved better performance than the conventional one for task completion time, task completion rate, and user's positive speech rate. In particular, these performance differences are greater for novice users than for experienced users.

DOI： 10.1109/APSIPA.2015.7415511

Web of Science

researchmap
Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization 査読国際誌

Masanobu Abe, Akihiko Hirayama, Sunao Hara

Proceedings of IEEE International Conference on Consumer Electronics (IEEE-ICCE 2015) 36 - 39 2015年1月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

This paper presents an algorithm to mine basic patterns of human activities on a daily basis using non-negative matrix factorization (NMF). The greatest benefit of the algorithm is that it can elicit patterns from which meanings can be easily interpreted. To confirm its performance, the proposed algorithm was applied to PC logging data collected from three occupations in offices. Daily patterns of software usage were extracted for each occupation. Results show that each occupation uses specific software in its own time period, and uses several types of software in parallel in its own combinations. Experiment results also show that patterns of 144 dimension vectors were compressible to those of 11 dimension vectors without degradation in occupation classification performance. Therefore, the proposed algorithm compressed basic software usage patterns to about one-tenth of their original dimensions while preserving the original information. Moreover, the extracted basic patterns showed reasonable interpretation of daily working patterns in offices.

DOI： 10.1109/ICCE.2015.7066309

Web of Science

researchmap
Sub-Band Text-to-Speech Combining Sample-Based Spectrum with Statistically Generated Spectrum 査読国際誌

Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki, Hideyuki Mizuno

Proceedings of Interspeech 2015 264 - 268 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

As described in this paper, we propose a sub-band speech synthesis approach to develop a high quality Text-to-Speech (TTS) system: a sample-based spectrum is used in the high-frequency band and spectrum generated by HMM-based TTS is used in the low-frequency band. Herein, sample-based spectrum means spectrum selected from a phoneme database such that it is the most similar to spectrum generated by HMM-based speech synthesis. A key idea is to compensate over-smoothing caused by statistical procedures by introducing a sample-based spectrum, especially in the high-frequency band. Listening test results show that the proposed method has better performance than HMM-based speech synthesis in terms of clarity. It is at the same level as HMM-based speech synthesis in terms of smoothness. In addition, preference test results among the proposed method, HMM-based speech synthesis, and waveform speech synthesis using 80 min speech data reveal that the proposed method is the most liked.

Web of Science

researchmap

その他リンク： http://dblp.uni-trier.de/db/conf/interspeech/interspeech2015.html#conf/interspeech/InaiHAIMM15
Sound collection and visualization system enabled participatory and opportunistic sensing approaches 査読国際誌

Sunao Hara, Masanobu Abe, Noboru Sonehara

Proceedings of 2015 IEEE International Conference on Pervasive Computing and Communication Workshops (PerCom Workshops) 390 - 395 2015年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

This paper presents a sound collection system to visualize environmental sounds that are collected using a crowd sourcing approach. An analysis of physical features is generally used to analyze sound properties; however, human beings not only analyze but also emotionally connect to sounds. If we want to visualize the sounds according to the characteristics of the listener, we need to collect not only the raw sound, but also the subjective feelings associated with them. For this purpose, we developed a sound collection system using a crowdsourcing approach to collect physical sounds, their statistics, and subjective evaluations simultaneously. We then conducted a sound collection experiment using the developed system on ten participants. We collected 6,257 samples of equivalent loudness levels and their locations, and 516 samples of sounds and their locations. Subjective evaluations by the participants are also included in the data. Next, we tried to visualize the sound on a map. The loudness levels are visualized as a color map and the sounds are visualized as icons which indicate the sound type. Finally, we conducted a discrimination experiment on the sound to implement a function of automatic conversion from sounds to appropriate icons. The classifier is trained on the basis of the GMM-UBM (Gaussian Mixture Model and Universal Background Model) method. Experimental results show that the F-measure is 0.52 and the AUC is 0.79.

DOI： 10.1109/PERCOMW.2015.7134069

Web of Science

researchmap

その他リンク： https://ousar.lib.okayama-u.ac.jp/ja/53271
Algorithm to Estimate a Living Area Based on Connectivity of Places with Home 査読国際誌

Yuji Matsuo, Sunao Hara, Masanobu Abe

HCI International 2015 - Posters’ Extended Abstracts (Part II), CCIS 529 529 570 - 576 2015年

　詳細を見る

記述言語：英語掲載種別：論文集(書籍)内論文出版者・発行元：SPRINGER-VERLAG BERLIN

We propose an algorithm to estimate a person's living area using his/her collected Global Positioning System (GPS) data. The most important feature of the algorithm is the connectivity of places with a home, i.e., a living area must consist of a home, important places, and routes that connect them. This definition is logical because people usually go to a place from home, and there can be several routes to that place. Experimental results show that the proposed algorithm can estimate living area with a precision of 0.82 and recall of 0.86 compared with the grand truth established by users. It is also confirmed that the connectivity of places with a home is necessary to estimate a reasonable living area.

DOI： 10.1007/978-3-319-21383-5_95

Web of Science

researchmap
Extraction of Key Segments from Day-Long Sound Data 査読国際誌

Akinori Kasai, Sunao Hara, Masanobu Abe

HCI International 2015 - Posters’ Extended Abstracts (Part I), CCIS 528 528 620 - 626 2015年

　詳細を見る

記述言語：英語掲載種別：論文集(書籍)内論文出版者・発行元：SPRINGER-VERLAG BERLIN

We propose a method to extract particular sound segments from the sound recorded during the course of a day in order to provide sound segments that can be used to facilitate memory. To extract important parts of the sound data, the proposed method utilizes human behavior based on a multisensing approach. To evaluate the performance of the proposed method, we conducted experiments using sound, acceleration, and global positioning system data collected by five participants for approximately two weeks. The experimental results are summarized as follows: (1) various sounds can be extracted by dividing a day into scenes using the acceleration data; (2) sound recorded in unusual places is preferable to sound recorded in usual places; and (3) speech is preferable to nonspeech sound.

DOI： 10.1007/978-3-319-21380-4_105

Web of Science

researchmap
Inhibitory Effects of an Orally Active Small Molecule Alpha4beta1/Alpha4beta7 Integrin Antagonist, TRK-170, on Spontaneous Colitis in HLA-B27 Transgenic Rats

Hiroe Hirokawa, Yoko Koga, Rie Sasaki, Sunao Hara, Hiroyuki Meguro, Mie Kainoh

GASTROENTEROLOGY 146 ( 5 ) S640 - S640 2014年5月

　詳細を見る

記述言語：英語出版者・発行元：W B SAUNDERS CO-ELSEVIER INC

Web of Science

researchmap
A graph-based spoken dialog strategy utilizing multiple understanding hypotheses 査読

Norihide Kitaoka, Yuji Kinoshita, Sunao Hara, Chiyomi Miyajima, Kazuya Takeda

Information and Media Technologies 9 ( 1 ) 111 - 120 2014年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：Information and Media Technologies Editorial Board

We regarded a dialog strategy for information retrieval as a graph search problem and proposed several novel dialog strategies that can recover from misrecognition through a spoken dialog that traverses the graph. To recover from misrecognition without seeking confirmation, our system kept multiple understanding hypotheses at each turn and searched for a globally optimal hypothesis in the graph whose nodes express understanding states across user utterances in a whole dialog. In the search, we used a new criterion based on efficiency in information retrieval and consistency with understanding hypotheses, which is also used to select an appropriate system response. We showed that our system can make more efficient and natural dialogs than previous ones.

DOI： 10.11185/imt.9.111

CiNii Article

researchmap
New approach to emotional information exchange: Experience metaphor based on life logs 査読国際誌

Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

2014 IEEE International Conference on Pervasive Computing and Communication Workshops, PerCom 2014 Workshops 191 - 194 2014年3月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

We are striving to develop a new communication technology based on individual experiences that can be extracted from life logs. We have proposed the "Emotion Communication Model" and confirmed that significant correlation exists between experience and emotion. As the second step, particularly addressing impressive places and events, this paper describes an investigation of the extent to which we can share emotional information with others through individuals' experiences. Subjective experiments were conducted using life log data collected during 7-47 months. Experiment results show that (1) impressive places are determined by the distance from home, visit frequency, and direction from home and that (2) positive emotional information is highly consistent among people (71.4%), but it is not true for negative emotional information. Therefore, experiences are useful as metaphors to express positive emotional information.

DOI： 10.1109/PerComW.2014.6815198

researchmap
Development of a Toolkit Handling Multiple Speech-Oriented Guidance Agents for Mobile Applications 査読国際誌

Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice 79 - 85 2014年

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：論文集(書籍)内論文出版者・発行元：Springer

DOI： 10.1007/978-1-4614-8280-2_8

researchmap
Evaluation of Invalid Input Discrimination Using Bag-of-Words for Speech-Oriented Guidance System 査読国際誌

Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

Natural Interaction with Robots, Knowbots and Smartphones, Putting Spoken Dialog Systems into Practice 389 - 397 2014年

　詳細を見る

記述言語：英語掲載種別：論文集(書籍)内論文出版者・発行元：Springer

DOI： 10.1007/978-1-4614-8280-2_35

researchmap
A Hybrid Text-to-Speech Based on Sub-Band Approach 査読国際誌

Takuma Inoue, Sunao Hara, Masanobu Abe

Proceedings of Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference 1 - 4 2014年

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

This paper proposes a sub-band speech synthesis approach to develop high-quality Text-to-Speech (TTS). For the low-frequency band and high-frequency band, Hidden Markov Model (HMM)-based speech synthesis and waveform -based speech synthesis are used, respectively. Both speech synthesis methods are widely known to show good performance and to have benefits and shortcomings from different points of view. One motivation is to apply the right speech synthesis method in the right frequency band. Experiment results show that in terms of the smoothness the proposed approach shows better performance than waveform -based speech synthesis, and in terms of the clarity it shows better than HMM-based speech synthesis. Consequently, the proposed approach combines the inherent benefits from both waveform-based speech synthesis and HMM-based speech synthesis.

DOI： 10.1109/APSIPA.2014.7041575

Web of Science

researchmap
音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却査読

真嶋温佳, 藤田洋子, トーレス・ラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

情報処理学会論文誌 54 ( 2 ) 443 - 451 2013年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

実環境における音声認識を用いた情報案内システムでは，雑音等の非音声やユーザ同士の背景会話など，システムへの入力として不適切な入力が存在する．これらの入力はシステムの誤作動・誤認識の原因となるので，システムへの入力として適切な入力（有効入力）と不適切な入力（無効入力）の識別を行い，無効入力を棄却することにより，無効入力に対する応答処理を行わないことが重要である．従来，有効入力と無効入力との識別には，メル周波数ケプストラム係数などの音響的特徴量によるGMM（Gaussian Mixture Model）が用いられる．しかし，入力データの音声認識結果から得られる言語的な情報を使うことにより，システムのタスクを考えたうえで有効入力と無効入力の識別が可能になると考えられる．そこで本論文では，音響特徴量にBag-of-Words（BOW）を言語的特徴量として併用した無効入力の識別を検討した．識別手法としては，サポートベクタマシン（SVM）および最大エントロピー法を用いた．実験には実環境音声情報案内システム「たけまるくん」の入力データを用いた．SVMによる識別結果では，GMMによる音響尤度のみを用いた場合に比べて，BOWを用いた場合，F尺度を82.19%から85.41%に改善することができた．さらに，GMMによる音響尤度，発話時間，SNRを組み合わせた特徴量にBOWを追加することで，F尺度を86.58%まで改善することができた．詳細な分析の結果，BOWは特に無効入力の誤受理を減らす効果があることが示された．On a real environment speech-oriented information guidance system, a valid and invalid input discrimination is important as invalid inputs such as noise, laugh, cough and utterances between users lead to unpredictable system responses. Generally, acoustic features such as MFCC (Mel-Frequency Cepstral Coefficient) are used for discrimination. Comparing acoustic likelihoods of GMMs (Gaussian Mixture Models) from speech data and noise data is one of the typical methods. In addition to that, using linguistic features, such as speech recognition result, is considered to improve discrimination accuracy as it reflects the task-domain of invalid inputs and meaningless recognition results from noise inputs. In this paper, we introduce Bag-of-Words (BOW) as a feature to discriminate between valid and invalid inputs. Support Vector Machine (SVM) and Maximum Entropy method (ME) are also employed to realize robust classification. We experimented the methods using real environment data obtained from the guidance system "Takemaru-kun." By applying BOW on SVM, the F-measure is improved to 85.09%, from 82.19% when using GMMs. In addition, experiments using features combining BOW with acoustic likelihoods from GMMs, Duration and SNR were conducted, improving the F-measure to 86.58%.

CiNii Article

CiNii Books

researchmap
音声対話システムの発話・動作タグN-gramを用いた課題未達成のオンライン検出査読

原直, 北岡教英, 武田一哉

電子情報通信学会論文誌 (D) J96-D ( 1 ) 81 - 93 2013年1月

　詳細を見る

担当区分：筆頭著者記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本論文ではN-gram特徴を用いた音声対話システム利用時の課題未達成対話の検出手法を提案する.実験にはユーザが自分のPC上で利用するという,実環境下で収録された楽曲検索のための音声対話システムとの対話データを利用する.楽曲検索課題を行っている全ての対話データはユーザとシステムの発話を抽象化した発話・動作ダグにより記述し,そのタグ系列をN-gramとしてモデル化を行う.本研究では,タグ系列中のタグN-gramの出現回数を素性として,Support Vector MachineやC4.5決定木などの識別的手法による課題未達成対話の検出実験を行った.更に対話長や反応時間などの対話の特徴を表す対話変数を導入することで検出性能の向上を行った.その結果,ユーザの4回目の発話までを用いることで,約76%の識別率となった.

CiNii Article

CiNii Books

researchmap

その他リンク： http://search.ieice.org/bin/summary.php?id=j96-d_1_81&category=D&year=2013&lang=J&abst=
Acoustic Model Training Using Pseudo-Speaker Features Generated by MLLR Transformations for Robust Speaker-Independent Speech Recognition 査読

Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

IEICE TRANSACTIONS on Information and Systems E95D ( 10 ) 2479 - 2485 2012年10月

　詳細を見る

記述言語：英語掲載種別：研究論文（学術雑誌）出版者・発行元：IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG

A novel speech feature generation-based acoustic model training method for robust speaker-independent speech recognition is proposed. For decades, speaker adaptation methods have been widely used. All of these adaptation methods need adaptation data. However, our proposed method aims to create speaker-independent acoustic models that cover not only known but also unknown speakers. We achieve this by adopting inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then we train our models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the transformation matrices for the existing speakers are estimated. Next, we construct pseudo-speaker transformations by sampling the weight parameters from the distribution, and apply the transformation to the normalized features of the existing speaker to generate the features of the pseudo-speakers. Finally, using these features, we train the acoustic models. Evaluation results show that the acoustic models trained using our proposed method are robust for unknown speakers.

DOI： 10.1587/transinf.E95.D.2479

Web of Science

researchmap

その他リンク： http://search.ieice.org/bin/summary.php?id=e95-d_10_2479
Causal analysis of task completion errors in spoken music retrieval interactions 査読国際誌

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of the 8th international conference on Language Resources and Evaluation (LREC 2012) 1365 - 1372 2012年5月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA

In this paper, we analyze the causes of task completion errors in spoken dialog systems, using a decision tree with N-gram features of the dialog to detect task-incomplete dialogs. The dialog for a music retrieval task is described by a sequence of tags related to user and system utterances and behaviors. The dialogs are manually classified into two classes: completed and uncompleted music retrieval tasks. Differences in tag classification performance between the two classes are discussed. We then construct decision trees which can detect if a dialog finished with the task completed or not, using information gain criterion. Decision trees using N-grams of manual tags and automatic tags achieved 74.2% and 80.4% classification accuracy, respectively, while the tree using interaction parameters achieved an accuracy rate of 65.7%. We also discuss more details of the causality of task incompletion for spoken dialog systems using such trees.

Web of Science

researchmap

その他リンク： http://www.lrec-conf.org/proceedings/lrec2012/summaries/1059.html
Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation 査読国際誌

Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of 2011 Automatic Speech Recognition and Understanding Workshop (ASRU 2011) 169 - 172 2011年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：IEEE

In this paper, we propose a novel acoustic model training method which is suitable for speaker adaptation in speech recognition. Our method is based on feature generation from a small amount of speakers' data. For decades, speaker adaptation methods have been widely used. Such adaptation methods need some amount of adaptation data and if the data is not sufficient, speech recognition performance degrade significantly. If the seed models to be adapted to a specific speaker can widely cover more speakers, speaker adaptation can perform robustly. To make such robust seed models, we adopt inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then train our seed models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the MLLR transformation matrices for the existing speakers is estimated. Next we generate pseudo-speaker MLLR transformations by sampling the weight parameters from the distribution, and apply the inverse of the transformation to the normalized existing speaker features to generate the pseudo-speakers' features. Finally, using these features, we train the acoustic seed models. Using this seed models, we obtained better speaker adaptation results than using simply environmentally adapted models. © 2011 IEEE.

DOI： 10.1109/ASRU.2011.6163925

Scopus

researchmap
Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations 査読国際誌

Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of 2011 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2011) 1 - 5 2011年12月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：APSIPA

In this paper a novel speech feature generationbased acoustic model training method is proposed. For decades, speaker adaptation methods have been widely used. All existing adaptation methods need adaptation data. However, our proposed method creates speaker-independent acoustic models that cover not only known but also unknown speakers. We do this by adopting inverse maximum likelihood linear regression (MLLR) transformation-based feature generation, and then train our models using these features. First we obtain MLLR transformation matrices from a limited number of existing speakers. Then we extract the bases of the MLLR transformation matrices using PCA. The distribution of the weight parameters to express the MLLR transformation matrices for the existing speakers are estimated. Next we generate pseudo-speaker MLLR transformations by sampling the weight parameters from the distribution, and apply the inverse of the transformation to the normalized existing speaker features to generate the pseudospeakers' features. Finally, using these features, we train the acoustic models. Evaluation results show that the acoustic models which are created are robust for unknown speakers.

Scopus

researchmap
On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors 査読国際誌

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of the Paralinguistic Information and Its Integration in Spoken Dialogue Systems Workshop 215 - 225 2011年9月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems 査読国際誌

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of INTERSPEECH 2011 1312 - 1315 2011年

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA-INT SPEECH COMMUNICATION ASSOC

We propose a method of detecting "task incomplete" dialogs in spoken dialog systems using N-gram-based dialog models. We used a database created during a field test in which inexperienced users used a client-server music retrieval system with a spoken dialog interface on their own PCs. In this study, the dialog for a music retrieval task consisted of a sequence of user and system tags that related their utterances and behaviors. The dialogs were manually classified into two classes: the dialog either completed the music retrieval task or it didn't. We then detected dialogs that did not complete the task, using N-gram probability models or a Support Vector Machine with N-gram feature vectors trained using manually classified dialogs. Off-line and on-line detection experiments were conducted on a large amount of real data, and the results show that our proposed method achieved good classification performance.

Web of Science

researchmap

その他リンク： http://www.isca-speech.org/archive/interspeech_2011/i11_1305.html
Music Recommendation System Based on Human-to-human Conversation Recognition 査読国際誌

Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Workshop Proceedings of the 7th International Conference on Intelligent Environments: Ambient Intelligence and Smart Environments 10 352 - 361 2011年

　詳細を見る

記述言語：英語掲載種別：論文集(書籍)内論文出版者・発行元：IOS PRESS

We developed an ambient system that plays music suitable for the mood of a human-human conversation using words obtained from a continuous-speech recognition system. Using the correspondence between a document space based on the texts related to the music and an acoustic space that expresses various audio features, the continuous-speech recognition results are mapped to an acoustic space. We performed a subjective evaluation of the system. The subjects rated the recommended music and the result reveals that the 10 most highly recommended selections included suitable music.

DOI： 10.3233/978-1-60750-795-6-352

Web of Science

researchmap
Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram 査読国際誌

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of INTERSPEECH2010 3034 - 3037 2010年9月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：ISCA

In this paper, we propose a method of detecting task-incompleted users for a spoken dialog system using an N-gram-based dialog history model. We collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database was made by a field test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model was trained from sequences that consist of user dialog acts and/or system dialog acts for two dialog classes, that is, the dialog completed the music retrieval task or the dialog incompleted the task. Then the system detects unknown dialogs that is not completed the task based on the N-gram likelihood. Experiments were conducted on large real data, and the results show that our proposed method achieved good classification performance. When the classifier correctly detected all of the task-incompleted dialogs, our proposed method achieved a false detection rate of 6%.

Web of Science

researchmap

その他リンク： http://www.isca-speech.org/archive/interspeech_2010/i10_3034.html
Rapid acoustic model adaptation using inverse MLLR-based feature generation 査読国際誌

Arata Ito, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

Proceedings of ICA2010 5 1 - 6 2010年8月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Scopus

researchmap
Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system 査読国際誌

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

LREC 2010 - SEVENTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION 78 - 83 2010年5月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA

In this paper, we propose an estimation method of user satisfaction for a spoken dialog system using an N-gram-based dialog history model. We have collected a large amount of spoken dialog data accompanied by usability evaluation scores by users in real environments. The database is made by a field-test in which naive users used a client-server music retrieval system with a spoken dialog interface on their own PCs. An N-gram model is trained from the sequences that consist of users' dialog acts and/or the system's dialog acts for each one of six user satisfaction levels: from 1 to 5 and phi (task not completed). Then, the satisfaction level is estimated based on the N-gram likelihood. Experiments were conducted on the large real data and the results show that our proposed method achieved good classification performance; the classification accuracy was 94.7% in the experiment on a classification into dialogs with task completion and those without task completion. Even if the classifier detected all of the task incomplete dialog correctly, our proposed method achieved the false detection rate of only 6%.

Web of Science

researchmap

その他リンク： http://www.lrec-conf.org/proceedings/lrec2010/summaries/579.html
Data collection and usability study of a PC-based speech application in various user environments 査読国際誌

Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Norihide Kitaoka, Kazuya Takeda

Proceedings of Oriental-COCOSDA 2008 39 - 44 2008年11月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap
In-car Speech Data Collection along with Various Multimodal Signals 査読国際誌

Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08) 1846 - 1851 2008年5月

　詳細を見る

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）出版者・発行元：EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA

In this paper, a large-scale real-world speech database is introduced along with other multimedia driving data. We designed a data collection vehicle equipped with various sensors to synchronously record twelve-channel speech, three-channel video, driving behavior including gas and brake pedal pressures, steering angles, and vehicle velocities, physiological signals including driver heart rate, skin conductance, and emotion-based sweating on the palms and soles, etc. These multimodal data are collected while driving on city streets and expressways under four different driving task conditions including two kinds of monologues, human-human dialog, and human-machine dialog. We investigated the response timing of drivers against navigator utterances and found that most overlapped with the preceding utterance due to the task characteristics and the features of Japanese. When comparing utterance length, speaking rate, and the filler rate of driver utterances in human-human and human-machine dialogs, we found that drivers tended to use longer and faster utterances with more fillers to talk with humans than machines.

Web of Science

researchmap

その他リンク： http://www.lrec-conf.org/proceedings/lrec2008/summaries/472.html
多様な音響環境下における音声認識システム利用時のデータ収集システム査読

原直, 宮島千代美, 伊藤克亘, 武田一哉

電子情報通信学会論文誌(D) J90-D ( 10 ) 2807 - 2816 2007年10月

　詳細を見る

担当区分：筆頭著者記述言語：日本語掲載種別：研究論文（学術雑誌）出版者・発行元：一般社団法人電子情報通信学会

多様なPC利用環境において音声認識の被験者実験を行うために,WWWを利用した音声対話システム及びそのデータ収集システムを構築した.本システムのユーザはPC上にインストールされたクライアントプログラムを用いることで音声対話によりPC内に蓄積された音楽を再生したり,音楽ダウンロードサイトの楽曲を試聴することができる.クライアントプログラムの利用により収集された音声データや対話ログはインターネットを介してサーバ上に蓄積される.サーバには,ユーザごとの辞書のカスタマイズ等の機能も実装している.本システムをインターネット上で試験的に公開し,2か月間のフィールドテストとしてデータ収集を行ったところ合計59時間のシステム稼動時データを収集した.そのうち約5時間41分のデータ(11351個)が音声区間として検出されており,システムに対して発話されていた音声データとして6335発話を得た.

CiNii Article

CiNii Books

researchmap
An online customizable music retrieval system with a spoken dialogue interface 査読国際誌

Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

The Journal of the Acoustical Society of America 120 ( 5-2 ) 3378 - 3379 2006年11月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

CiNii Article

researchmap
Novel orally active alpha 4 integrin antagonist, T-728, attenuates dextran sodium sulfate-induced chronic colitis in mice

Ken-Ichi Hayashi, Hiroyuki Meguro, Sunao Hara, Rie Sasaki, Yoko Koga, Meiko Takeshita, Naoyoshi Yamamoto, Hiroe Hirokawa, Mie Kainoh

GASTROENTEROLOGY 130 ( 4 ) A352 - A352 2006年4月

　詳細を見る

記述言語：英語出版者・発行元：W B SAUNDERS CO-ELSEVIER INC

0

Web of Science

researchmap
Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System 査読国際誌

Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

Proceedings of Oriental-COCOSDA 2005 164 - 168 2005年12月

　詳細を見る

担当区分：筆頭著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

researchmap

▼全件表示

MISC

機械学習による環境音からの主観的な騒音マップ生成招待

原直, 阿部匡伸

騒音制御 46 ( 3 ) 126 - 130 2022年6月

　詳細を見る

担当区分：筆頭著者記述言語：日本語掲載種別：記事・総説・解説・論説等（学術雑誌）

researchmap
クラウドセンシングによる環境音の収集招待

阿部匡伸, 原直

騒音制御 42 ( 1 ) 20 - 23 2018年

　詳細を見る

記述言語：日本語掲載種別：記事・総説・解説・論説等（学術雑誌）

researchmap
スマートデバイスによる音収録とその応用招待

原直

日本音響学会誌 73 ( 8 ) 483 - 490 2017年8月

　詳細を見る

担当区分：筆頭著者記述言語：日本語掲載種別：記事・総説・解説・論説等（学術雑誌）出版者・発行元：日本音響学会

DOI： 10.20697/jasj.73.8_483

CiNii Article

CiNii Books

researchmap
イベントを比喩に用いた感情伝達法の検討査読

濱野和人, 原直, 阿部匡伸

電子情報通信学会論文誌 J97-D ( .12 ) 1680 - 1683 2014年12月

　詳細を見る

記述言語：日本語掲載種別：速報，短報，研究ノート等（学術雑誌）出版者・発行元：電子情報通信学会

researchmap
ライフログ研究から見た音響信号の活用招待

原直, 阿部匡伸

騒音制御 38 ( 1 ) 15 - 21 2014年

　詳細を見る

担当区分：筆頭著者記述言語：日本語掲載種別：記事・総説・解説・論説等（学術雑誌）出版者・発行元：日本騒音制御工学会

CiNii Article

CiNii Books

researchmap
「音声対話システムの実用化に向けて」10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術招待

西村竜一, 原直, 川波弘道, LEE Akinobu, 鹿野清宏

人工知能学会誌 28 ( 1 ) 52 - 59 2013年1月

　詳細を見る

記述言語：日本語掲載種別：記事・総説・解説・論説等（学術雑誌）出版者・発行元：一般社団法人人工知能学会

DOI： 10.11517/jjsai.28.1_52

CiNii Article

CiNii Books

J-GLOBAL

researchmap
音声対話システムの発話系列N-gramを利用した課題未達成対話の検出査読

原直, 北岡教英, 武田一哉

電子情報通信学会論文誌. D, 情報・システム J94-D ( 2 ) 497 - 500 2011年2月

　詳細を見る

記述言語：日本語掲載種別：速報，短報，研究ノート等（学術雑誌）出版者・発行元：電子情報通信学会情報・システムソサイエティ

音声対話システムの利用によって課題を達成できなかった対話の検出を行う.ユーザとシステムの発話を抽象化した発話・動作系列をN-gramによりモデル化し,課題未達成対話を検出する実験を行ったところ,良好な結果が得られたので報告する.

CiNii Article

CiNii Books

researchmap
音声対話システムのテキスト音声合成における声質変換とx-vector埋め込みを用いた感情制御方式の検討

小原俊一, 阿部匡伸, 原直

日本音響学会講演論文集 1275 - 1278 2023年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

researchmap
ウェアラブルデバイスを用いた曖昧な入力からの会話支援システムの検討

岩崎茉理, 原直, 阿部匡伸

日本音響学会講演論文集 1369 - 1372 2023年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

researchmap
小説オーディオブックの強調部分を学習に用いる抑揚制御可能な End-to-End 音声合成方式の検討

和田拓海, 阿部匡伸, 原直

日本音響学会講演論文集 903 - 906 2023年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

researchmap
ライフログに基づく共感的対話システムにおけるユーザの感情極性に応じた応答生成方式の検討

前薗そよぎ, 原直, 阿部匡伸

電子情報通信学会技術研究報告 122 ( 423 ) 102 - 107 2023年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
音声対話システムのための入力音声の感情に同調する声質変換とx-vector埋め込みを用いたテキストからの音声合成方式の検討

小原俊一, 原直, 阿部匡伸

電子情報通信学会技術研究報告 122 ( 389 ) 203 - 208 2023年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
GPSデータに基づく粒度変更可能な生活圏を用いた個人認証のための類似度計算方式の検討

遠山大督, 原直, 阿部匡伸

電子情報通信学会技術研究報告 122 ( 338 ) 25 - 30 2023年1月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
差分メルケプストラムを用いた声質変換による喉締め歌唱音声改善方式の検討

植田遥人, 阿部匡伸, 原直

日本音響学会講演論文集 1405 - 1408 2022年9月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

researchmap
ライフログに応じて発話を変えることでユーザに親密さを感じさせる対話システムの検討

前薗そよぎ, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2022）講演論文集 1182 - 1190 2022年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
話者特徴量の操作によりシームレスに話者性を制御できるEnd-to-End音声合成方式の検討

青谷直樹, 原直, 阿部匡伸

電子情報通信学会技術研究報告 122 ( 81 ) 55 - 60 2022年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
音声と映像から議論への関与姿勢を推定するための特徴量の検討

金岡翼, 原直, 阿部匡伸

電子情報通信学会技術研究報告 121 ( 401 ) 57 - 62 2022年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
SSQPによる場所の印象情報を環境音と航空写真から推定する方式の検討

小野祐介, 原直, 阿部匡伸

電子情報通信学会技術研究報告 121 ( 401 ) 51 - 56 2022年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
口唇特徴量を利用した知識蒸留による舌亜全摘出者の音韻明瞭度改善法の検討

高島和嗣, 阿部匡伸, 原直

電子情報通信学会技術研究報告 121 ( 385 ) 108 - 113 2022年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
バックコーラス歌唱合成のためのDNNを用いた自然性の高い歌声合成方式の検討

木岡智宏, 阿部匡伸, 原直

電子情報通信学会技術研究報告 121 ( 385 ) 102 - 107 2022年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
インソール型圧力センサを用いたパーキンソン病重症度推定

林倖生, 原直, 阿部匡伸, 武本麻美

電子情報通信学会総合大会（H-4-7） 2022年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人電子情報通信学会

researchmap
環境音と航空写真を用いた場所の印象を推定する方式の検討

小野祐介, 原直, 阿部匡伸

第24回日本音響学会関西支部若手研究者交流研究発表会発表概要集 34 - 34 2021年12月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：日本音響学会関西支部

researchmap
歌声合成のための双方向LSTM によるビブラート表現方式の検討

金子隼人, 阿部匡伸, 原直

日本音響学会講演論文集 1109 - 1112 2021年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
音素情報を知識蒸留する舌亜全摘出者の音韻明瞭度改善法

高島和嗣, 阿部匡伸, 原直

日本音響学会講演論文集 1057 - 1060 2021年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
パーキンソン病重症度推定に向けたインソール型圧力センサで計測した歩行データの分析

林倖生, 原直, 阿部匡伸, 武本麻美

第20回情報科学技術フォーラム (FIT 2021)，CK-001 3 71 - 74 2021年8月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
人対人の会話で自然な話題展開を支援するための対話戦略の検討

前薗そよぎ, 原直, 阿部匡伸

情報処理学会研究報告 2021-SLP-137 ( 16 ) 1 - 6 2021年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

長塚弘亮, 川上滋央, 古寺寛志, 佐藤匡晃, 田中祐貴, 兒玉直紀, 原直, 皆木省吾

日本顎顔面補綴学会第38回総会・学術大会 30 - 30 2021年6月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：日本顎顔面補綴学会

researchmap
ニューラル機械翻訳により推定された読み仮名・韻律記号を入力とする日本語 End-to-End 音声合成の評価

懸川直人, 原直, 阿部匡伸, 井島勇祐

日本音響学会講演論文集 847 - 850 2021年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
Evaluation of Concept Drift Adaptation for Acoustic Scene Classifier Based on Kernel Density Drift Detection and Combine Merge Gaussian Mixture Model

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

日本音響学会講演論文集 201 - 204 2021年3月

　詳細を見る

記述言語：英語出版者・発行元：日本音響学会

researchmap
歌唱表現を付与できるBidirectional-LSTM を用いた歌声合成方式の検

金子隼人, 原直, 阿部匡伸

日本音響学会講演論文集 987 - 990 2021年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
TTSによる会話支援システムのための感圧センサを用いた手袋型入力デバイスの開発と入力速度の評価

小林誠, 原直, 阿部匡伸

情報処理学会研究報告 2020-HCI-190 ( 20 ) 1 - 6 2020年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
パーキンソン病重症度推定のためのインソール型圧力センサを用いた時間的特徴量の検討

林倖生, 原直, 阿部匡伸, 武本麻美

2020年度(第71回)電気・情報関連学会中国支部連合大会，R20-14-02-03 1 - 1 2020年10月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：電気・情報関連学会中国支部

researchmap
Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定

懸川直人, 原直, 阿部匡伸, 井島勇祐

日本音響学会講演論文集 829 - 832 2020年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
WaveNetを用いた言語情報なし感情音声合成における感情の強さ制御の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会講演論文集 867 - 870 2020年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
映像と音声を用いた議論への関与姿勢や肯定的・否定的態度の推定方式の検討

金岡翼, 上原佑太郎, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2020）講演論文集 1422 - 1429 2020年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
話題の対象に対する親密度に応じて応答する音声対話システムの検討

加藤大地, 原直, 阿部匡伸

情報処理学会研究報告 2020-SLP-132 ( 21 ) 1 - 6 2020年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
GPSデータのクラスタリングによる日常生活における場所の重要度の分析

平田瑠, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2020）講演論文集 785 - 793 2020年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
ウェアラブルデバイスによる曖昧な入力からのニューラル機械翻訳を用いた日本語文章推定方式

渡邊淳, 原直, 阿部匡伸

情報処理学会研究報告 2020-HCI-187 ( 7 ) 1 - 7 2020年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
舌亜全摘出者の音韻明瞭度改善のための推定音素事後確率を用いた声質変換の検討

荻野聖也, 原直, 阿部匡伸

電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション予稿集 124 - 124 2020年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人電子情報通信学会

researchmap
End-to-End 音声認識を用いた音声合成の半教師あり話者適応国際共著

井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

日本音響学会講演論文集 1095 - 1098 2020年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
言語情報なし感情合成音を学習に用いたCycleGANによる感情変換方式の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会講演論文集 1165 - 1168 2020年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
End-to-End 音声認識を用いた End-to-End 音声合成の性能評価

井上勝喜, 原直, 阿部匡伸, 渡部晋治

第22回日本音響学会関西支部若手研究者交流研究発表会概要集 6 - 6 2019年12月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：日本音響学会関西支部

researchmap
WaveNet による言語情報を含まない感情音声合成方式における話者性の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会講演論文集 993 - 996 2019年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
新たにデザインされた人工舌と解剖学的人工舌の効果ならびにその選択基準

佐藤匡晃, 長塚弘亮, 川上滋央, 兒玉直紀, 原直, 阿部匡伸, 皆木省吾

日本補綴歯科学会中国・四国支部学術大会，抄録集 28 - 28 2019年9月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：日本補綴歯科学会

researchmap
CNN Autoencoderから抽出したボトルネック特徴量を用いた環境音分類

松原拓未, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2019）講演論文集 339 - 346 2019年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
GPSデータに基づく日常生活における特別な行動の検出

小林誠, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2019）講演論文集 846 - 853 2019年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
WaveNetによる言語情報を含まない感情音声合成方式の検討

松本剣斗, 原直, 阿部匡伸

情報処理学会研究報告 2019-SLP-127 ( 61 ) 1 - 6 2019年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
i-vectorに基づく賑わい音の推定方式の検討

呉セン陽, 朝田興平, 原直, 阿部匡伸

情報処理学会研究報告 2019-SLP-127 ( 33 ) 1 - 6 2019年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

井上勝喜, 原直, 阿部匡伸, 井島勇祐

日本音響学会講演論文集 1085 - 1088 2019年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
声質変換による舌亜全摘出者の音韻明瞭度改善のための音素補助情報の推定方式の検討

荻野聖也, 村上博紀, 原直, 阿部匡伸

日本音響学会講演論文集 1155 - 1158 2019年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
舌亜全摘出者の音韻明瞭度改善のための Bidirectional LSTM-RNN に基づく音素補助情報を用いた声質変換方式の検討

村上博紀, 原直, 阿部匡伸

日本音響学会講演論文集 1151 - 1154 2019年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
ながら聴き用楽曲の作業負荷に及ぼす影響とその選択方式の検討

高瀬郁, 阿部匡伸, 原直

情報処理学会研究報告 2018-MUS-121 ( 19 ) 1 - 6 2018年11月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
DNN音声合成における感情付与方式の評価

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会講演論文集 1105 - 1108 2018年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
Speech Enhancement of Glossectomy Patient's Speech using Voice Conversion Approach

Masanobu Abe, Seiya Ogino, Hiroki Murakami, Sunao Hara

日本生物物理学会第56回年会，シンポジウム：ヘルスシステムの理解と応用 198 - 198 2018年9月

　詳細を見る

担当区分：責任著者記述言語：英語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：日本生物物理学会

researchmap
声質変換による舌亜全摘出者の音韻明瞭度改善のための補助情報の検討

村上博紀, 原直, 阿部匡伸

日本音響学会講演論文集 1175 - 1178 2018年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
クラウドソーシングによる環境音マップ構築のための主観的な騒々しさ推定方式の検討

原直, 阿部匡伸

第17回情報科学技術フォーラム (FIT 2018)，O-001 4 343 - 346 2018年9月

　詳細を見る

担当区分：筆頭著者,　責任著者記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
音声と口唇形状を用いた声質変換による舌亜全摘出者の音韻明瞭度改善の検討

荻野聖也, 村上博紀, 原直, 阿部匡伸

電子情報通信学会技術研究報告 118 ( 112 ) 7 - 12 2018年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

村上博紀, 荻野聖也, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

日本音響学会講演論文集 355 - 358 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
DNN音声合成における感情付与のための継続時間長モデルの検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会講演論文集 279 - 282 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
クラウドソーシングによる賑わい音識別方式のフィールド実験評価

朝田興平, 原直, 阿部匡伸

日本音響学会講演論文集 79 - 82 2018年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
DNN音声合成における話者と感情の情報を扱うためのモデル構造の検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会講演論文集 263 - 266 2017年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
DNNに基づく差分スペクトル補正を用いた声質変換による舌亜全摘出者の音韻明瞭性改善の検討

村上博紀, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

日本音響学会講演論文集 297 - 300 2017年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
DNNによる人間の感覚を考慮した騒々しさ推定方式に基づく騒音マップの作成

小林将大, 原直, 阿部匡伸

日本音響学会講演論文集 623 - 626 2017年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
環境音収集に効果的なインセンティブを与える可視化方式の検討査読

畠山晏彩子, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2017）講演論文集 255 - 262 2017年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
DNN音声合成における感情付与のためのモデル構造の検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

電子情報通信学会技術研究報告 117 ( 106 ) 23 - 28 2017年6月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

researchmap
2つの粒度の生活圏に基づく見守りシステム

鎌田成紀, 原直, 阿部匡伸

電子情報通信学会総合大会 (D-9-12) 1 - 1 2017年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：一般社団法人電子情報通信学会

researchmap
DNNによる人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

小林将大, 原直, 阿部匡伸

日本音響学会講演論文集 799 - 802 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類

鳥羽隼司, 原直, 阿部匡伸

日本音響学会講演論文集 139 - 142 2017年3月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
基本周波数変形を考慮したスペクトル変換手法の検討査読

床建吾, 阿部匡伸, 原直

第18回IEEE広島支部学生シンポジウム（HISS 18th） 174 - 176 2016年11月

　詳細を見る

記述言語：日本語出版者・発行元：IEEE広島支部

researchmap
RNNによる実環境データからのマルチ音響イベント検出

鳥羽隼司, 原直, 阿部匡伸

日本音響学会講演論文集 43 - 44 2016年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
スマートフォンで収録した環境音に含まれるタップ音除去方式の検討

朝田興平, 原直, 阿部匡伸

日本音響学会講演論文集 45 - 48 2016年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討

原直, 田中智康, 阿部匡伸

日本音響学会講演論文集 3 - 6 2016年9月

　詳細を見る

担当区分：筆頭著者,　責任著者記述言語：日本語出版者・発行元：日本音響学会

researchmap
GMMに基づく声質変換を用いた舌亜全摘出者の音韻明瞭性改善の検討

田中慧, 原直, 阿部匡伸, 皆木省吾

日本音響学会講演論文集 141 - 144 2016年9月

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

researchmap
主観的評価に基づいた騒音マップ構築のためのクラウドソーシングによる環境音収集システム

原直, 小林将大, 阿部匡伸

電子情報通信学会技術研究報告 116 ( 189 ) 41 - 46 2016年8月

　詳細を見る

担当区分：筆頭著者,　責任著者記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Article

CiNii Books

researchmap
GPSデータ匿名化レベルの主観的許容度を客観的に表現する指標の検討査読

三藤優介, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2016）講演論文集 798 - 805 2016年7月

　詳細を見る

担当区分：責任著者記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式査読

小林将大, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2016）講演論文集 141 - 148 2016年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

researchmap
滞在地ネットワークに基づく滞在地間の移動傾向を表現する尺度の検討

大藤高史, 原直, 阿部匡伸

電子情報通信学会技術研究報告 116 ( 23 ) 95 - 100 2016年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Article

researchmap
生活圏を応用したプライバシーに配慮可能な見守り方式の検討 (情報通信マネジメント)

鎌田成紀, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 409 ) 19 - 24 2016年1月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Article

researchmap
A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model 査読

Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

The Journal of the Acoustical Society of America 140 ( 4 ) 3110 - 3110 2016年

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（国際会議）

DOI： 10.1121/1.4969721

researchmap
振り返り支援における効率的な映像要約のための自動収集ライフログ活用法 (ライフインテリジェンスとオフィス情報システム)

大西杏菜, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 27 ) 23 - 28 2015年5月

　詳細を見る

記述言語：日本語出版者・発行元：電子情報通信学会

CiNii Article

researchmap
振り返り支援における効率的な映像要約のための自動収集ライフログ活用法

大西杏菜, 原直, 阿部匡伸

情報処理学会研究報告. GN, [グループウェアとネットワークサービス] 2015 ( 4 ) 1 - 6 2015年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

ライフログを活用する場面の一つとして,自らの過去の振り返りが挙げられる.本報告では,映像を用いた振り返り支援方式に着目し,長時間の映像を効率よく要約するための自動収集ライフログ活用法について検討した.イベントでのライフログデータ (GPS・脈拍・音声) を収集し,それらのデータからライフログの要約に重要と考えられる点を抽出した.その後,抽出された点の時刻を基準にしてイベント中に同時収録された体験映像から映像の一部を切り出し,被験者に対して提示することで評価実験を行った.実験の結果,要約映像を用いた振り返りでは従来方法による振り返りよりも,ユーザにかかる負担が低いこと,多数の出来事を想起できることが示された.

CiNii Article

CiNii Books

researchmap
滞在地の特徴量を利用した「特別な日」検索方式 (ライフインテリジェンスとオフィス情報システム)

林啓吾, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 500 ) 89 - 94 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

近年,自分の行動を記録したライフログが注目されている.ライフログを用いて振り返りを行うためには振り返りに必要なデータを検索する必要がある.本報告では,GPSデータから抽出される滞在地の特徴量を用いていつもと違う「特別な日」を検索する方式を検討した.提案方式の有用性を検証するための評価実験システムを作成し,7名の被験者を対象とする評価実験を行った.特別な日の検索精度を検証したところ,特別な日を60%,非日常を90%の精度で検索できることが分かった.主観的な評価として従来手法と提案方式を利用した振り返りの有効性,効率,満足度を比較した.従来手法より少し効率は劣るものの,有効性と満足度は高く,多くのことを詳細に振り返ることができることがわかった.

CiNii Article

CiNii Books

researchmap
滞在地と経路に着目した生活圏抽出法 (ライフインテリジェンスとオフィス情報システム)

松尾雄二, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 500 ) 77 - 82 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

高齢化社会における認知症高齢者の徘徊行動や児童の犯罪被害増加などが社会問題となり,世間の見守りに対する関心は高まっている.そこで本報告では,GPSデータのログを滞在地と経路に分類し,見守りシステムに応用するための生活圏抽出法を検討した.滞在地の抽出は滞在地と移動経路との頻度の関係から抽出法を提案した.移動経路の抽出は最良優先探索を用いた抽出法について提案した.被験者3名の生活圏を抽出し,適合率,再現率を用いて評価した.提案手法は頻度のみで抽出する手法より適合率が最大約0.5増加し,再現率は最大0.6増加した.この結果から提案手法が有効であることが確認された.

CiNii Article

CiNii Books

researchmap
移動経路のパターン分類による人の行動分析 (ライフインテリジェンスとオフィス情報システム)

瀬藤諒, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 500 ) 31 - 36 2015年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告では,人がどの程度行動的であるのかという行動特徴に着目し,位置情報を用いた人の行動分析を検討した.移動経路データを用いて,主成分分析(PCA)と非負債行列因子分解(NMF)のそれぞれの手法により,行動的であるかを判定できるかを検討した.結果より,PCAから求めた重要な固有値の数とNMFによる近似誤差は,行動的であるかを判定に有効であると確認できた.さらに,移動経路のパターン抽出を行うことで,PCAとNMFで抽出される移動経路パターンの違いを検討した.それにより,PCAでは頻度の多いパターンが抽出されるのに対し,NMFでは頻度の少ないパターンも抽出されることが明らかになった.

CiNii Article

CiNii Books

researchmap
FLAG: 位置情報を基軸としたライフログ集約システム

笠井昭範, 原直, 阿部匡伸

研究報告ユビキタスコンピューティングシステム（UBI） 2014 ( 6 ) 1 - 6 2014年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

GPS による位置情報を用いたアプリケーションやサービスが広く普及している．本研究では，GPS から取得した位置情報をもとに，様々なライフログを集約するシステム FLAG を開発した．FLAG では位置情報を滞在地と移動経路に分類して管理を行う．分類した位置情報は地図とタイムテーブル上に可視化され，滞在地にはユーザごとに個別の名称を登録する機能を設けた．また，様々なライフログを集約する例として Twitter における投稿時間から FLAG の持つ位置情報と結びつけを行う．これにより，位置情報を持たないライフログの地図上への可視化が可能となる．システムの評価では，6 名の被験者により滞在地の正解データを作成し，FLAG の滞在地検出精度について 2 種類の検出法を用いて比較を行った．結果， FLAG では元データに比べて高い精度による滞在地の検出が確認された．Recently, the application and the service which utilize location information from GPS have highly prevailed. In this paper, we developed the system called FLAG which aggregates the variety of Lifelog under location information. FLAG manages location information discriminate between moving and staying. With using FLAG, we visualize categorized location information on the map and the time table. And implement set the function which registers individual name according to users in the staying state. We also link the location information from FLAG to Twitter using the posting time for an example of aggregating various kinds of Lifelog, This function enables Lifelog to show on the map even if the Lifelog has no positional information. For an evaluation of the FLAG system, we created correct data of staying by six users. And we compared accuracies of staying by using two detection methods. As a result, we confirmed that FLAG can be detected high accuracy staying than the original data.

CiNii Article

CiNii Books

researchmap

その他リンク： http://id.nii.ac.jp/1001/00102345/
FLAG : 位置情報を基軸としたライフログ集約システム(「ユビキタスコンピューティング技術とサービスコンピューティング」及び一般)

笠井昭範, 原直, 阿部匡伸

電子情報通信学会技術研究報告. SC, サービスコンピューティング 114 ( 157 ) 29 - 34 2014年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

GPSによる位置情報を用いたアプリケーションやサービスが広く普及している.本研究では,GPSから取得した位置情報をもとに,様々なライフログを集約するシステムFLAGを開発した.FLAGでは位置情報を滞在地と移動経路に分類して管理を行う.分類した位置情報は地図とタイムテーブル上に可視化され,滞在地にはユーザごとに個別の名称を登録する機能を設けた.また,様々なライフログを集約する例としてTwitterにおける投稿時間からFLAGの持つ位置情報と結びつけを行う.これにより,位置情報を持たないライフログの地図上への可視化が可能となる.システムの評価では,6名の被験者により滞在地の正解データを作成し,FLAGの滞在地検出精度について2種類の検出法を用いて比較を行った.結果,FLAGでは元データに比べて高い精度による滞在地の検出が確認された.

CiNii Article

CiNii Books

researchmap
スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発 (音声音学シンポジウム2014)

原直, 笠井昭範, 阿部匡伸, 曽根原登

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 52 ) 177 - 180 2014年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする.例えば,環境音の一つとして環境騒音問題を考えると,車や鉄道などの特徴的な音だけではなく,道や公園の賑わいのような生活雑音も考慮する必要がある.しかし,日常的かつ広範囲な音を少人数で収録することは容易ではない.そこで,クラウドソーシングによる収録を行うことで,環境音測定に必要な膨大な空間を覆うことを目指す.Android OSを搭載したスマートデバイスで動作するアプリケーションの試作を行い,さらに収録音の集積と閲覧のためのサーバシステムの試作を行った.本報告では開発した環境音収集システムの概要と環境音収録実験について紹介する.

CiNii Article

CiNii Books

researchmap
GPSデータから構築したネットワークにおけるノード次数に基づく行動分析法の検討

藤岡大輔, 原直, 阿部匡伸

研究報告ユビキタスコンピューティングシステム（UBI） 2014 ( 6 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

個人の位置情報履歴から構築したネットワークの構造的特徴を基に個人の行動分析を行う手法について検討する．本報告では，GPS から取得した位置情報履歴を利用して構築された有向ネットワークを滞在地ネットワークと呼ぶ．滞在地ネットワークでは位置情報履歴から抽出された滞在地をノードとして扱う．一般に，有向なネットワークの個々のノードは出次数と入次数という構造的特徴量を持っている．滞在地ネットワークでは個々のノードが持つ出次数と入次数やそれらの比には偏りがある．そこで，この偏り度合いにはその滞在地における人の行動と関係性があると仮定して，その関係性を分析した．特に，人の行動結果の一つと考えられる滞在地の滞在目的に着目して，次数の偏り度合いと滞在目的との関係性について分析した．We discuss a behavior-anaysis method based on strucural features in networks constructed from a personal location history. In this paper, a directed network constructed from GPS location history is called a stay network. Stay network treat set of stay extratcted from the location history as nodes in networks. Generally, nodes of directed networks have out-degrees and in-degrees as structural features. The stay network has biased values of out-degrees, in-degrees and their ratio. Therefore, we assumed existance of relationships between the degree of biased values and human behaviors in the stay, and analyzed the relationships. We forcused on a purpose of the stay, which is assumed to be occur as a result of human behavior, and particularly analyzed relationships between the degree of biased values and the purpose of the stay.

CiNii Article

CiNii Books

researchmap
スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発

原直, 笠井昭範, 阿部匡伸, 曽根原登

研究報告音楽情報科学（MUS） 2014 ( 36 ) 1 - 4 2014年5月

　詳細を見る

記述言語：日本語

本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする．例えば，環境音の一つとして環境騒音問題を考えると，車や鉄道などの特徴的な音だけではなく，道や公園の賑わいのような生活雑音も考慮する必要がある．しかし，日常的かつ広範囲な音を少人数で収録することは容易ではない．そこで，クラウドソーシングによる収録を行うことで，環境音測定に必要な膨大な空間を覆うことを目指す．Android OS を搭載したスマートデバイスで動作するアプリケーションの試作を行い，さらに収録音の集積と閲覧のためのサーバシステムの試作を行った[１]．本報告では開発した環境音収集システムの概要と環境音収録実験について紹介する．In this study, we aimed to construct environmental sound database for various sounds as Wisdom of the crowds. For example, considering environmental noise-pollution problems as a kind of the environmental sound, we need to consider not only signature sound, e.g. car noise and railway noise, but also life-space noise, e.g. festivity noise on streets or in parks. However, daily/widely sound collection is difficult to substantiate by few participant. Therefore, we aimed to measure environmental sound covered a vast area by applying crowdsourcing approach. First, we develop a prototype application which is run on the smart device with Android OS, and then we develop a prototype server system for collection and browsing the collected sound data. Then, we calibrated noise level measured by smart devices and carried out a sound collection experiment for validate an accuracy of sensors on the smart devices [1]. In this report, we introduce the environemental sound collection system and the sound-collection experiment using the system.

CiNii Article

CiNii Books

researchmap
車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

山岡将綺, 原直, 阿部匡伸

情報処理学会研究報告. SLP, 音声言語情報処理 2014 ( 7 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

運転中の利用に適した対話方法を提案するため，ユーザ負荷の観点で対話戦略を評価した．対話の主導権の方式と確認発話の方式を組み合わせて，客観評価実験である計算機シミュレーションを行った．シミュレーションの条件として，システムがユーザに余裕があるときのみ発話する条件と，ユーザが正しく聞き取れる割合の条件を設定した．また，これらの方式を実装した音声対話システムを利用した主観評価実験を行った．これらの評価から，ユーザ主導の対話戦略は認識率が高いとターン数やタスク達成時間が少なく優れているという結果を得た．一方，システム主導や混合主導の対話戦略は認識率が低い場合にターン数やタスク達成時間がユーザ主導の対話戦略よりも低く優れているという結果を得た．余裕があるときのみ発話する場合は，タスク達成までに時間がかかるため効率が悪いが，ユーザが感じる負担はほとんどないという結果を得た．We assess dialog strategies from user's workload standpoint to suggest usage of spoken dialog systems while driving. We evaluate several dialog strategies, which are combinations of methods of dialog initiative and confirmation manner, with objective evaluation method using computer simulation. Two conditions of the simulation are set up; One is that the system speaks if the user has leeway to talk with the system, and the another one is that the system speaks even if the user will be fail to recognize the system's. We also evaluate spoken dialog systems applying these methods with subjective evaluation method. As a result of the evaluations, user initiative strategy has advantages in lower turn number and lower task completion rate than both system initiative strategy and mixed initiative strategies when cognitive rate is high. The result also shows that system initiative strategy and mixed initiative strategy have advantages in lower turn number and lower task completion rate than user initiative strategy when cognitive rate is low. Additionally, the result shows that the method, which system speaks only when user has enough time driving operation, makes user's workload low, however, it need more time to complete tasks.

CiNii Article

CiNii Books

researchmap
非負値行列因子分解によるPC操作ログからの勤務パタン抽出 (ライフインテリジェンスとオフィス情報システム)

平山明彦, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 ( 32 ) 33 - 38 2014年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告ではPC操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた.一日を単位とし,どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した.3つの職種を分析した結果,職種に依存する特徴的な勤務パタンを抽出することができた.また,一部には職種に共通する勤務パタンも抽出された.非負値行列因子分解の利点は基底の解釈が容易な点にあるが,抽出されたパタンから,あるソフトウェアをある時間帯に集中的に利用する勤務パタンや,複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した.

CiNii Article

CiNii Books

researchmap
車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

山岡将綺, 原直, 阿部匡伸

研究報告自然言語処理（NL） 2014 ( 7 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

運転中の利用に適した対話方法を提案するため，ユーザ負荷の観点で対話戦略を評価した．対話の主導権の方式と確認発話の方式を組み合わせて，客観評価実験である計算機シミュレーションを行った．シミュレーションの条件として，システムがユーザに余裕があるときのみ発話する条件と，ユーザが正しく聞き取れる割合の条件を設定した．また，これらの方式を実装した音声対話システムを利用した主観評価実験を行った．これらの評価から，ユーザ主導の対話戦略は認識率が高いとターン数やタスク達成時間が少なく優れているという結果を得た．一方，システム主導や混合主導の対話戦略は認識率が低い場合にターン数やタスク達成時間がユーザ主導の対話戦略よりも低く優れているという結果を得た．余裕があるときのみ発話する場合は，タスク達成までに時間がかかるため効率が悪いが，ユーザが感じる負担はほとんどないという結果を得た．We assess dialog strategies from user's workload standpoint to suggest usage of spoken dialog systems while driving. We evaluate several dialog strategies, which are combinations of methods of dialog initiative and confirmation manner, with objective evaluation method using computer simulation. Two conditions of the simulation are set up; One is that the system speaks if the user has leeway to talk with the system, and the another one is that the system speaks even if the user will be fail to recognize the system's. We also evaluate spoken dialog systems applying these methods with subjective evaluation method. As a result of the evaluations, user initiative strategy has advantages in lower turn number and lower task completion rate than both system initiative strategy and mixed initiative strategies when cognitive rate is high. The result also shows that system initiative strategy and mixed initiative strategy have advantages in lower turn number and lower task completion rate than user initiative strategy when cognitive rate is low. Additionally, the result shows that the method, which system speaks only when user has enough time driving operation, makes user's workload low, however, it need more time to complete tasks.

CiNii Article

CiNii Books

researchmap
非負値行列因子分解によるPC操作ログからの勤務パタン抽出

平山明彦, 原直, 阿部匡伸

研究報告セキュリティ心理学とトラスト（SPT） 2014 ( 6 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語

本報告では PC 操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた．一日を単位とし，どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した．3 つの職種を分析した結果，職種に依存する特徴的な勤務パタンを抽出することができた．また，一部には職種に共通する勤務パタンも抽出された．非負値行列因子分解の利点は基底の解釈が容易な点にあるが，抽出されたパタンから，あるソフトウェアをある時間帯に集中的に利用する勤務パタンや，複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した．In this paper, we tried to extract working patterns by nonnegative matrix factorization using PC operation logs. Experiments were carried out for three occupations, in terms of daily-basis working patterns, we successfully extracted particular patterns for each occupation and some common working patterns for all occupations. We also presented that the extracted patterns can be easily interpreted as the ways of working.

CiNii Article

CiNii Books

researchmap
非負値行列因子分解によるPC操作ログからの勤務パタン抽出

平山明彦, 原直, 阿部匡伸

研究報告グループウェアとネットワークサービス（GN） 2014 ( 6 ) 1 - 6 2014年5月

　詳細を見る

記述言語：日本語

本報告では PC 操作ログから非負値行列因子分解によって勤務パタンの抽出を試みた．一日を単位とし，どの時間帯にどのソフトウェアを利用しているかのパタンを抽出した．3 つの職種を分析した結果，職種に依存する特徴的な勤務パタンを抽出することができた．また，一部には職種に共通する勤務パタンも抽出された．非負値行列因子分解の利点は基底の解釈が容易な点にあるが，抽出されたパタンから，あるソフトウェアをある時間帯に集中的に利用する勤務パタンや，複数のソフトウェアを並列して利用する勤務パタンなどの解釈が可能であることを示した．In this paper, we tried to extract working patterns by nonnegative matrix factorization using PC operation logs. Experiments were carried out for three occupations, in terms of daily-basis working patterns, we successfully extracted particular patterns for each occupation and some common working patterns for all occupations. We also presented that the extracted patterns can be easily interpreted as the ways of working.

CiNii Article

CiNii Books

researchmap
滞在地の特徴量を利用した「特別な日」検索方式の検討

林啓吾, 原直, 阿部匡伸

第76回全国大会講演論文集 2014 ( 1 ) 459 - 460 2014年3月

　詳細を見る

記述言語：日本語

ライフログとは，人間の行動をデジタルデータとして記録に残すことである．ライフログデータを用いて自分の行動を振り返ることを考える．例えば，現在広く普及しているSocial Networking Service（SNS）の過去の発言や写真を見返すことで，振り返りが可能であるが，それらに記録するのは自分の意志で記録したいと思ったことに限られてしまうという問題点がある．無意識に記録できるライフログデータの一つに，Global Positioning System (GPS) による位置情報データ（GPS データ）があげられる．本研究では，GPSデータから得られる滞在地の特徴量を利用し，振り返りたいと感じる「特別な日」を検索する方式を提案した．評価実験により，提案方式で「特別な日」が高い精度で検索可能であることが示された．

CiNii Article

CiNii Books

researchmap
滞在地と経路に着目した生活圏抽出法の検討

松尾雄二, 原直, 阿部匡伸

第76回全国大会講演論文集 2014 ( 1 ) 37 - 38 2014年3月

　詳細を見る

記述言語：日本語

近年、高齢者による徘徊行動が社会問題となっている。既存の見守りシステムではあらかじめ行動範囲を設定する必要があり、その範囲も詳細に決定できないため十分な見守りが不可能である。そこで、本研究では蓄積したGPSデータを用いて見守りシステムに応用するための生活圏(行動範囲)を抽出する方法を検討する。GPSデータに含まれる位置情報(緯度経度)をGEOHEXを用いてHEXコードという量子化符号に変換する。それらのHEXコードを滞在地と経路に分類し、頻度の高いHEXコードをそれぞれの生活圏として抽出し、滞在地に属するデータの生活圏と経路に属するデータの生活圏の整合性を評価した。

CiNii Article

CiNii Books

researchmap
D-9-4 他人との行動ログ比較による個人の行動特徴分析(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)

瀬藤諒, 阿部匡伸, 原直

電子情報通信学会総合大会講演論文集 2014 ( 1 ) 88 - 88 2014年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Article

CiNii Books

researchmap
クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

原直, 笠井昭範, 阿部匡伸, 曽根原登

電子情報通信学会技術研究報告 113 ( 479 ) 29 - 34 2014年3月

　詳細を見る

担当区分：筆頭著者記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究ではあらゆる環境音を対象とした集合知としての環境音データベース構築を目的とする.例えば,環境音の一つとして環境騒音問題を考えると,車や鉄道などの特徴的な音だけではなく,道や公園の賑わいのような生活雑音も考慮する必要がある.しかし,日常的かつ広範囲な音を少人数で収録することは容易ではない.そこで,クラウドソーシングによる収録を行うことで,環境音測定に必要な膨大な空間を覆うことを目指す. Android OSを搭載したスマートデバイスで動作するアプリケーションの試作を行い,さらに収録音の集積と閲覧のためのサーバシステムの試作を行った.また,スマートデバイス搭載のセンサ群の精度を検証するために,騒音レベルの校正と環境音収録実験を行った.実験では900分の環境音データを収録し,収録された騒音レベルと主観的な評価値の関係性を分析した.

CiNii Article

CiNii Books

researchmap
音声波形の高域利用によるHMM音声合成方式の評価

井上拓真, 原直, 阿部匡伸

日本音響学会研究発表会講演論文集日本音響学会編 349 - 352 2014年

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Article

researchmap
音素波形選択型音声合成方式に用いるデータベースサイズと主観評価との関係分析

稻井禎, 原直, 阿部匡伸

日本音響学会研究発表会講演論文集日本音響学会編 331 - 334 2014年

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Article

researchmap
クラウドセンシングにより収集された環境音のシンボル表現を用いた音地図構築手法

原直, 阿部匡伸, 曽根原登

日本音響学会研究発表会講演論文集日本音響学会編 1535 - 1538 2014年

　詳細を見る

記述言語：日本語出版者・発行元：日本音響学会

CiNii Article

researchmap
音響信号とマルチセンサー信号を利用したスマートフォンによる自動車の燃費推定 (信号処理)

難波祥平, 原直, 阿部匡伸

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 ( 28 ) 1 - 6 2013年5月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

自動車の燃費計が搭載された車が増えているが,燃費データは表示するだけであり,外部へ出力して蓄積や分析などの再利用は行えない.外部へ車両のデータを出力する方法としては,診断用コネクタを利用してOBD2規格のデータから速度,回転数燃料消費率を取り出す方法がある.しかし,プロトコルがメーカーや車種により異なっているため,一般利用には向いていない.本研究ではスマートフォンで得られる音響信号と各種センサーの値を用いて自動車の燃費推定を行う.燃費推定にはエンジン回転数の推定とトルクの推定が必要となる.エンジン回転数は,エンジン音に高速フーリエ変換を行い,混合ガンマ分布で近似したロードノイズを除去した音響信号から求める.トルクは各種センサーの値と自動車の諸元から自動車の物理法則を用いて求める.得られたエンジン回転数とトルクに対して,事前に収集した燃料消費率の対応表を用いて燃費を推定する.スマートフォンを用いた燃費推定の実験の結果,最終的な平均燃費に誤差があるものの,瞬間燃費の大まかな変化を知るという目的に十分な数値が得られた.

CiNii Article

CiNii Books

researchmap
GPSデータから抽出した滞在地のネットワークにおける個人の特徴分析 (ライフインテリジェンスとオフィス情報システム)

藤岡大輔, 原直, 阿部匡伸

電子情報通信学会技術研究報告 : 信学技報 112 ( 466 ) 179 - 184 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本報告ではGPSロガーによって取得したデータから個人毎の滞在地のネットワークを作り,ネットワーク構造に着目した新たな行動分析の手法について述べる.本報告では6名の被験者のGPSデータを用いて滞在地のネットワークのスケールフリー性,スモールワールド性,クラスター性を分析し,身の回りの他のネットワークとの比較,またモチーフの分布から滞在地のネットワーク特有の点を分析した.さらにノード間の繋がり方に着目し,ハブとなっている度合いと,そのノードに出入りするノードの種類数の偏りを数値化することで,被験者間でのネットワークの違いを明らかにした.

CiNii Article

CiNii Books

researchmap
他者のライフログからの類似した印象を持つイベント抽出法の検討 (ライフインテリジェンスとオフィス情報システム)

濱野和人, 阿部匡伸, 原直, 藤岡大輔, 望月理香, 渡部智樹

電子情報通信学会技術研究報告 : 信学技報 112 ( 466 ) 173 - 178 2013年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

自身の経験を相手に伝えるとき,同様な印象を想起するような相手の過去の経験に置き換えて説明することで,理解を深められることがある.そこで本稿では,ライフログから伝え手と受け手が同様な印象を持つイベントを抽出する方法について検討した.まず,数種類の感情を提示して,被験者に幾つかのイベントを思い出させた.これらのイベントに対し,各イベントから想起される感情を項目ごとに数値化させて類似度を求める方法と,ディスカッションにより各イベントの類似度を決める方法とを比較した.その結果,ディスカッションによる方法による類似度の決定ではイベントに対する強い感情が主たる要因となっていることが明らかになった.

CiNii Article

CiNii Books

researchmap
音声情報案内システムにおけるBag‐of‐Wordsを用いた無効入力棄却モデルの可搬性の評価

真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

日本音響学会研究発表会講演論文集(CD-ROM) 2013 ROMBUNNO.3-9-5 2013年3月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
学生・若手フォーラム第2期活動報告(活動報告)

岡本拓磨, 奥園健, 木谷俊介, 原直, 太田達也, 井本桂右

日本音響学会誌 69 ( 9 ) 519 - 520 2013年

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人日本音響学会

DOI： 10.20697/jasj.69.9_519

CiNii Article

researchmap
音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

日本音響学会研究発表会講演論文集(CD-ROM) 2012 ROMBUNNO.3-1-8 2012年9月

　詳細を見る

記述言語：日本語

J-GLOBAL

researchmap
音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

真嶋温佳, 藤田洋子, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

情報処理学会研究報告. SLP, 音声言語情報処理 2012 ( 7 ) 1 - 6 2012年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

実環境音声情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する.これらの入力はシステムの誤作動・誤認識の原因となるので,無効入力として棄却して応答処理を行わないことが重要である.一般に,有効入力と無効入力との識別にはGMM (Gaussian Mixture Model) による方法など,音響的な情報に基づく方法が用いられることが多い.しかし,入力データに含まれる言語的な情報を使うことにより,システムのタスクも考慮した,より高精度な有効入力と無効入力の識別が可能になると考えられる.そこで本論文では,音声認識結果から得られるBag-of-Words (BOW) を特徴量として,サポートベクターマシン(SVM)および最大エントロピー法を用いた無効入力の識別を検討した.実環境音声情報案内システム「たけまるくん」の入力データを用いた実験では,GMMを用いたSVMによる無効入力の識別と較べ,F尺度を81.73%から83.61%に改善することができた.また,BOW,GMMによる音響尤度,発話時間,SNRを組み合わせた場合,F尺度を86.57%まで改善することができた.

CiNii Article

CiNii Books

researchmap
クラウド時代の新しい音声研究パラダイム

秋葉友良, 岩野公司, 緒方淳, 小川哲司, 小野順貴, 篠崎隆宏, 篠田浩一, 南條浩輝, 西崎博光, 西田昌史, 西村竜一, 原直, 堀貴明

情報処理学会研究報告. SLP, 音声言語情報処理 2012 ( 4 ) 1 - 7 2012年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

個人が複数の携帯情報端末を所有し,そこで得られたあらゆる音声データをクラウドに蓄積することが容易になりつつある.このように音声情報処理の周辺環境・技術が激変していく中で,音声情報処理技術のより一層の高度化が求められている.その期待に応えるためには,クラウド処理を前提とした音声研究プラットフォームの構築と,それを基盤とした新しい音声研究のパラダイムが必要である.本稿では,現在までに培われてきた音声情報処理技術を概観した上で,新しい研究パラダイムの方向性とそこで生じる新たな課題について議論する.

CiNii Article

CiNii Books

researchmap
携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

原直, 川波弘道, 猿渡洋, 鹿野清宏

情報処理学会研究報告. SLP, 音声言語情報処理 2012 ( 1 ) 1 - 6 2012年7月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では携帯端末用の音声情報案内システム開発に向けたネットワークサービスソフトウェアの開発について検討する.このソフトウェアは2002年11月よりコミュニティセンターに設置されたたけまるくんシステムを基礎としている.本システムは,音声認識,対話管理,テキスト音声合成を統合したシステムである.WWWサイト開発者にも使いやすいような,Software-as-a-Service (SaaS) を目指すとともに,熟練した開発者や研究者にも使いやすいパッケージとしての展開を検討する.

CiNii Article

CiNii Books

researchmap
D-9-36 多様な利用環境における音声情報案内サービスソフトウェアの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)

原直, 川波弘道, 猿渡洋, 鹿野清宏

電子情報通信学会総合大会講演論文集 2012 ( 1 ) 168 - 168 2012年3月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Article

CiNii Books

researchmap
ブラインド音源分離の信頼度を用いたマルチバンド音声認識 (音声)

安藤厚志, 大橋宏正, 原直, 北岡教英, 武田一哉

電子情報通信学会技術研究報告 : 信学技報 111 ( 431 ) 219 - 224 2012年2月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

ブラインド音源分離は音声認識の精度の向上に応用されるが,従来の音源分離法は音声認識の単なる前処理としてしか利用されなかった.本稿では,周波数領域独立成分分析によるブラインド音源分離法と組み合わせたマルチバンド音声認識手法を提案する.音源分離時において,各周波数ごとの分離行列の正確さを推定し,その周波数の信頼度とする.次段の処理では,音源分離の信頼度とメル尺度フィルタバンクエネルギーに基づきマルチバンド音声認識手法により音響尤度を計算する.提案法では音源分離行列の推定誤りとICA後のdepermutation誤りを原因とする認識誤りを削減することが可能となる.提案法を用いて雑音下での孤立単語認識実験を行った結果,単語正解率が平均8.2%,単語正解精度が平均5.7%向上することを確認した.

CiNii Article

CiNii Books

researchmap
多様な利用環境における音声情報案内サービスソフトウェアの開発

原直

信学総大講演論文集, 2012 168 2012年

　詳細を見る

CiNii Article

researchmap
MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル (音声言語情報処理(SLP) Vol.2010-SLP-84)

伊藤新, 原直, 北岡教英

情報処理学会研究報告 2010 ( 5 ) 1 - 6 2011年2月

　詳細を見る

記述言語：日本語出版者・発行元：情報処理学会

CiNii Article

CiNii Books

researchmap
MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル (音声)

伊藤新, 原直, 北岡教英

電子情報通信学会技術研究報告 110 ( 357 ) 55 - 60 2010年12月

　詳細を見る

出版者・発行元：電子情報通信学会

CiNii Article

researchmap
雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)

大橋宏正, 北岡教英, 原直, 武田一哉

電子情報通信学会技術研究報告. SP, 音声 110 ( 220 ) 59 - 64 2010年10月

　詳細を見る

記述言語：日本語出版者・発行元：社団法人電子情報通信学会

音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.

CiNii Article

CiNii Books

researchmap
音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 (言語理解とコミュニケーション)

原直, 北岡教英, 武田一哉

電子情報通信学会技術研究報告 109 ( 355 ) 77 - 82 2009年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

CiNii Article

researchmap
音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

原直, 北岡教英, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2009 ( 14 ) 1 - 6 2009年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人情報処理学会

本論文では,音声対話システムの対話履歴を N-gram によってモデル化を行い、その尤度に基づいてユーザ満足度の推定を行う手法を提案する.実験では音声対話による楽曲検索システムを利用した実環境音声データに収録されているユーザとシステムの対話履歴を利用して各ユーザの満足度を N-gram の尤度を用いて推定する.それぞれの満足度レベル毎の N-gram モデルは,ユーザの対話行動とシステムの対話行動を符号化した系列を利用することで作成される.本論文では,作成したモデルを用いて満足度の推定を行いその分類性能を評価した.実験結果より,提案手法は高い分類性能を示しており,特にタスク達成者とタスク未達成者の分類では全てのタスク未達成者を検出する際の誤検出率を 10% に抑えることができた.

CiNii Article

CiNii Books

researchmap
音声認識システムの満足度評価におけるユーザモデル

原直, 北岡教英, 武田一哉

電子情報通信学会技術研究報告. SP, 音声 108 ( 338 ) 61 - 66 2008年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフィールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

CiNii Article

CiNii Books

researchmap
多様な利用環境における楽曲検索音声対話システムのフィールドテストと評価

原直, 宮島千代美, 伊藤克亘, 北岡教英, 武田一哉

情報処理学会第70回全国大会講演論文集 70 ( 5 (3L-4) ) 5-341 - 5-342 2008年3月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：社団法人情報処理学会

CiNii Article

CiNii Books

researchmap
音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)

原直, 北岡教英, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2008 ( 123 ) 61 - 66 2008年

　詳細を見る

記述言語：日本語出版者・発行元：社団法人情報処理学会

楽曲検索音声対話システムを用いたフィールドテストによるデータを用いて音声対話システムのユーザ満足度を推測する数学的モデルについて検討を行った.本研究ではユーザ満足度の背景となる心理尺度として,ユーザの主観に基づく体感認識精度を導入する.体感認識精度は満足度の指標や様々なユーザプロファイルとともにフイールドテストの事後アンケートを通じて収集した.まず,体感認識精度が対話データの書き起こしに基づいた客観認識精度指標よりも満足度指標と関係が高いことを示す.続いて,体感・客観認識精度の同時分布に対するトップダウンクラスタリングによってユーザのグループを認識精度に対する鋭敏さという観点により分類を行う.体感認識精度を与えうる客観認識精度の下限についてもこの同時分布を用いて計算を行う.最後に,ユーザプロファイルや環境条件を用いてユーザ満足度指標を推測するためのグラフモデルを構築し,分散の約13%に相当するユーザ満足度分布の不確かさを削減することを示す.

CiNii Article

CiNii Books

researchmap
多様な音響環境下における音声認識システム利用時のデータ収集システム(音声,聴覚)

原直, 宮島千代美, 伊藤克亘, 武田一哉

電子情報通信学会論文誌. D, 情報・システム 90 ( 10 ) 2807 - 2816 2007年10月

　詳細を見る

記述言語：日本語出版者・発行元：社団法人電子情報通信学会

多様なPC利用環境において音声認識の被験者実験を行うために,WWWを利用した音声対話システム及びそのデータ収集システムを構築した.本システムのユーザはPC上にインストールされたクライアントプログラムを用いることで音声対話によりPC内に蓄積された音楽を再生したり,音楽ダウンロードサイトの楽曲を試聴することができる.クライアントプログラムの利用により収集された音声データや対話ログはインターネットを介してサーバ上に蓄積される.サーバには,ユーザごとの辞書のカスタマイズ等の機能も実装している.本システムをインターネット上で試験的に公開し,2か月間のフィールドテストとしてデータ収集を行ったところ合計59時間のシステム稼動時データを収集した.そのうち約5時間41分のデータ(11351個)が音声区間として検出されており,システムに対して発話されていた音声データとして6335発話を得た.

CiNii Article

CiNii Books

researchmap
楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討(音響・音韻モデル)

原直, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2007 ( 75 ) 87 - 90 2007年7月

　詳細を見る

記述言語：日本語出版者・発行元：社団法人情報処理学会

本論文では楽曲検索システムの音声インタフェースに適用するための与えられた認識語彙集合に最適なHMM 音響モデルを学習するための手法について述べる。本論文が対象とする楽曲検索アプリケーションにおいては各ユーザ毎にHMM 音響モデルをカスタマイズすることが重要である、なぜなら、1)楽曲名やアーティスト名には一般的なテキスト読み上げコーパスには出現しないような音韻コンテキストが存在すること、2)ユーザによって蓄積している音楽が異なっていること、が理由としてあげられる。特に、認識語彙集合に対して最適な状態共有構造を探すということは音響モデルの学習における新しい問題である。そこで本研究では100名以上の話者による合成音声を用いてタスクに関連した語彙発話を生成しタスク依存音響モデルを構築する手法を提案する。フィールドテストによる評価実験の結果、提案手法により作成したタスク依存音響モデルはタスク非依存音響モデルに比べて約10%の単語誤り削減率を達成することを確認した。

CiNii Article

CiNii Books

researchmap
楽曲検索音声対話システムの評価 (感性)

原直, 伊藤克亘, 北岡教英

シンポジウムモバイル研究論文集 2007 47 - 50 2007年

　詳細を見る

記述言語：日本語出版者・発行元：モバイル学会

CiNii Article

researchmap
汎用PC上で利用された音声対話システムによる音声収集と評価

原直, 宮島千代美, 伊藤克亘, 武田一哉

電子情報通信学会技術研究報告. SP, 音声 106 ( 443 ) 167 - 172 2006年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

実際の利用環境に近づけた被験者実験を行うために,WWW経由でカスタマイズ可能な音声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される.本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.

CiNii Article

CiNii Books

researchmap
汎用PC上で利用された音声対話システムによる音声収集と評価(第8回音声言語シンポジウム)

原直, 宮島千代美, 伊藤克亘, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2006 ( 136 ) 167 - 172 2006年

　詳細を見る

記述言語：日本語出版者・発行元：社団法人情報処理学会

実際の利用環境に近づけた被験者実験を行うために, WWW経由でカスタマイズ可能な音声対話システム及びそのデータ収集システムを構築した.本システムのユーザは自分のPCに音声認識システムをインストールし利用する.不特定多数のユーザに対応するために,インターネット上に用意されたリモートサーバ上で各ユーザが本システムのカスタマイズすることが可能である.さらに,本システムを利用する各ユーザのPCで収録された音声データはインターネットを通してリモートサーバに送信される.本システムを利用することにより,複数のユーザによる実環境下における音声認識システム利用時データを収集することが可能になる.本論文では実際に本システムを使用したフィールドテストを行いデータ収集及び分析を行った.インターネット上に公開して2ヶ月間で59時間のデータが収集され,そのうち約5時間41分のデータ(11351個)が音声区間として検出されていた.認識実験の結果,検出された音声データからシステムに対して発話されていた音声データ4716発話を評価用データとした場合の単語正解率は66.0%であり,各ユーザ毎に教師無しMLLR適応を行うことで単語正解率は70.5%に向上した.

CiNii Article

CiNii Books

researchmap
長期間の音声対話インタフェース利用時における学習効果の評価

原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

日本音響学会研究発表会講演論文集 2005 ( 1 ) 153 - 154 2005年3月

　詳細を見る

記述言語：日本語

CiNii Article

CiNii Books

researchmap
音声対話インタフェースの長期利用時における学習効果の評価

原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2005 ( 12 ) 17 - 22 2005年

　詳細を見る

記述言語：日本語出版者・発行元：社団法人情報処理学会

本研究では車内での利用を想定した音声対話による楽曲検索システムを構築している.このシステムは, ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.以前の報告ではユーザが約1時間の間システムを利用する実験を行った.この実験において被験者によって度合は異なるものの, 習熟することにより認識性能が向上するという知見が得られた.そこで, 本報告では, 被験者がシステムに十分慣れるように, 1時間のセッションを5回繰り返す実験を行った.実験により収録した12名の音声を分析した結果, 最終日において初日の約60%の誤り改善率を得た.

CiNii Article

CiNii Books

researchmap
音声対話による楽曲検索システム(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)

原直, 白勢彩子, 宮島千代美, 伊藤克亘, 武田一哉

情報処理学会研究報告. SLP, 音声言語情報処理 2004 ( 103 ) 31 - 36 2004年2月

　詳細を見る

記述言語：日本語出版者・発行元：社団法人情報処理学会

近年,音声認識技術を用いた様々なアプリケーションが考えられている.例えば,ハンズフリーで利用できるという特徴を生かして,カーナビゲーションシステムなどに利用されている.また,インターネット経由の楽曲ダウンロードシステムが増えており,使いやすい楽曲検索インタフェースへの期待が高まっている.そこで本研究では車内での利用を想定した音声対話による楽曲検索システムを作成した.このシステムは,ユーザが対話によって聞きたい楽曲を検索し再生するというシステムである.本報告ではシステムの詳細及びシステムを用いた音声対話の収録について述べる.プロトタイプを用いて約150名の被験者実験を行った結果,室内で約80%,実車運転時で約76%の単語正解率を得た.

CiNii Article

CiNii Books

researchmap
ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討

白勢彩子, 原直, 藤村浩司, 伊藤克亘, 武田一哉, 板倉文忠

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 103 ( 518 ) 7 - 12 2003年12月

　詳細を見る

記述言語：日本語出版者・発行元：一般社団法人電子情報通信学会

本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ,会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.

CiNii Article

CiNii Books

researchmap
ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討

白勢彩子, 原直, 藤村浩司, 伊藤克亘, 武田一哉, 板倉文忠

情報処理学会研究報告 2003 ( 124 (2003-SLP-049) ) 253 - 258 2003年12月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：社団法人情報処理学会

本研究は,音声対話システムの利用に必要な知識,技術の学習過程および問題点を明らかとし,これらがシステム評価に与える影響を検討するため,実システムを用いた観察実験を行ない,それによって得られた結果に基づいて,ユーザの達成度とアンケートによるシステム評価との関連性に関する基礎的な議論を行なった.分析の結果,発話認識率と発話数とに相関がある評価項目はほとんどなく,むしろ、会話満足度,システム理解度と多く関連することが明らかとなった.従来,認識率とシステム評価とがよく一致することが知られているが,他の観点からの評価も考慮する必要があることが示唆された.今後は,被験者数を増大させて条件を統制した実験を行ない,より詳細な議論をしていきたい.

CiNii Article

CiNii Books

researchmap
汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価

原直, 河口信夫, 武田一哉, 板倉文忠

情報処理学会研究報告 2003 ( 14 (2002-SLP-045) ) 131 - 136 2003年2月

　詳細を見る

記述言語：日本語掲載種別：研究発表ペーパー・要旨（全国大会，その他学術会議）出版者・発行元：社団法人情報処理学会

携帯情報端末(PDA)での音声認識の研究を進めるために,汎用音声認識エンジンJulius/JulianをPDA上に移植し,その性能評価を行った.その結果,孤立単語音声認識では,Linux上で動作させた場合に比べて認織率はわずかに低下するが,PDAで実時間の約1.9倍で90%の認識率を得ることができた.連続数字音声認識ではPDAで収録した音声で学習することにより,約99%の認識率を得た.

CiNii Article

CiNii Books

researchmap

▼全件表示

講演・口頭発表等

人対人の会話で自然な話題展開を支援するための対話戦略の検討

前薗そよぎ, 原直, 阿部匡伸

音学シンポジウム2021（情報処理学会音声言語処理研究会） 2021年6月18日情報処理学会

　詳細を見る

開催年月日： 2021年6月18日 - 2021年6月19日

記述言語：日本語会議種別：ポスター発表

researchmap
呼気流路の容易な制御を目的とした面接触型人工舌の構音改善に関する実験的研究

長塚弘亮, 川上滋央, 古寺寛志, 佐藤匡晃, 田中祐貴, 兒玉直紀, 原直, 皆木省吾

日本顎顔面補綴学会第38回総会・学術大会 2021年6月4日

　詳細を見る

開催年月日： 2021年6月3日 - 2021年6月5日

記述言語：日本語会議種別：ポスター発表

researchmap
ニューラル機械翻訳により推定された読み仮名・韻律記号を入力とする日本語 End-to-End 音声合成の評価

懸川直人, 原直, 阿部匡伸, 井島勇祐

日本音響学会2021年春季研究発表会 2021年3月11日日本音響学会

　詳細を見る

開催年月日： 2021年3月10日 - 2021年3月12日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Evaluation of Concept Drift Adaptation for Acoustic Scene Classifier Based on Kernel Density Drift Detection and Combine Merge Gaussian Mixture Model

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

日本音響学会2021年春季研究発表会 2021年3月10日日本音響学会

　詳細を見る

開催年月日： 2021年3月10日 - 2021年3月12日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
歌唱表現を付与できるBidirectional-LSTM を用いた歌声合成方式の検討

金子隼人, 原直, 阿部匡伸

日本音響学会2021年春季研究発表会 2021年3月10日日本音響学会

　詳細を見る

開催年月日： 2021年3月10日 - 2021年3月12日

記述言語：日本語会議種別：ポスター発表

researchmap
TTSによる会話支援システムのための感圧センサを用いた手袋型入力デバイスの開発と入力速度の評価

小林誠, 原直, 阿部匡伸

情報処理学会第190回ヒューマンコンピュータインタラクション研究発表会 2020年12月9日情報処理学会

　詳細を見る

開催年月日： 2020年12月8日 - 2020年12月9日

記述言語：日本語会議種別：口頭発表（一般）

開催地：淡路夢舞台国際会議場＆オンライン

researchmap
Module Comparison of Transformer-TTS for Speaker Adaptation based on Fine-tuning 国際会議

Katsuki Inoue, Sunao Hara, Masanobu Abe

APSIPA Annual Summit and Conference 2020 2020年12月 APSIPA

　詳細を見る

開催年月日： 2020年12月7日 - 2020年12月10日

記述言語：英語会議種別：口頭発表（一般）

開催地：Auckland, New Zealand (Virtual/Online)

researchmap

その他リンク： https://ieeexplore.ieee.org/document/9306250
Concept Drift Adaptation for Acoustic Scene Classifier Based on Gaussian Mixture Model 国際会議

Ibnu Daqiqil Id, Masanobu Abe, Sunao Hara

The 2020 IEEE Region 10 Conference (IEEE-TENCON 2020) 2020年11月 IEEE

　詳細を見る

開催年月日： 2020年11月16日 - 2020年11月19日

記述言語：英語会議種別：口頭発表（一般）

開催地：Osaka, Japan (Virtual/Online)

researchmap
Controlling the Strength of Emotions in Speech-like Emotional Sound Generated by WaveNet 国際会議

Kento Matsumoto, Sunao Hara, Masanobu Abe

Interspeech 2020 2020年10月 ISCA

　詳細を見る

開催年月日： 2020年10月25日 - 2020年10月29日

記述言語：英語会議種別：口頭発表（一般）

開催地：Shanghai, China (Virtual/Online)

researchmap
パーキンソン病重症度推定のためのインソール型圧力センサを用いた時間的特徴量の検討

林倖生, 原直, 阿部匡伸

2020年度(第71回)電気・情報関連学会中国支部連合大会 2020年10月24日

　詳細を見る

開催年月日： 2020年10月24日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定

懸川直人, 原直, 阿部匡伸, 井島勇祐

日本音響学会2020年秋季研究発表会 2020年9月11日日本音響学会

　詳細を見る

開催年月日： 2020年9月9日 - 2020年9月11日

記述言語：日本語会議種別：口頭発表（一般）

開催地：オンライン

researchmap
WaveNetを用いた言語情報なし感情音声合成における感情の強さ制御の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会2020年秋季研究発表会 2020年9月10日日本音響学会

　詳細を見る

開催年月日： 2020年9月9日 - 2020年9月11日

記述言語：日本語会議種別：ポスター発表

開催地：オンライン

researchmap
映像と音声を用いた議論への関与姿勢や肯定的・否定的態度の推定方式の検討

金岡翼, 上原佑太郎, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2020） 2020年6月26日情報処理学会

　詳細を見る

開催年月日： 2020年6月24日 - 2020年6月26日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
GPSデータのクラスタリングによる日常生活における場所の重要度の分析

平田瑠,原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2020） 2020年6月25日情報処理学会

　詳細を見る

開催年月日： 2020年6月24日 - 2020年6月26日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
End-to-End 音声認識を用いた音声合成の半教師あり話者適応国際共著

井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

音学シンポジウム2020（エキシビションASJ代替発表） 2020年6月7日情報処理学会

　詳細を見る

開催年月日： 2020年6月6日 - 2020年6月7日

記述言語：日本語会議種別：ポスター発表

researchmap
話題の対象に対する親密度に応じて応答する音声対話システムの検討

加藤大地, 原直, 阿部匡伸

音学シンポジウム2020（情報処理学会音声言語処理研究会） 2020年6月6日情報処理学会

　詳細を見る

開催年月日： 2020年6月6日 - 2020年6月7日

記述言語：日本語会議種別：ポスター発表

researchmap
Semi-supervised speaker adaptation for end-to-end speech synthesis with the pretrained models 国際共著国際会議

Katsuki Inoue, Sunao Hara, Masanobu Abe, Tomoki Hayashi, Ryuichi Yamamoto, Shinji Watanabe

ICASSP 2020 2020年5月 IEEE

　詳細を見る

開催年月日： 2020年5月4日 - 2020年5月8日

記述言語：英語会議種別：口頭発表（一般）

開催地：Barcelona, Spain (Virtual/Online)

researchmap
舌亜全摘出者の音韻明瞭度改善のための推定音素事後確率を用いた声質変換の検討

荻野聖也, 原直, 阿部匡伸

電子情報通信学会総合大会 2020年3月17日電子情報通信学会

　詳細を見る

開催年月日： 2020年3月17日 - 2020年3月18日

記述言語：日本語会議種別：ポスター発表

researchmap
言語情報なし感情合成音を学習に用いたCycleGANによる感情変換方式の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会2020年春季研究発表会 2020年3月18日日本音響学会

　詳細を見る

開催年月日： 2020年3月16日 - 2020年3月18日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
End-to-End 音声認識を用いた音声合成の半教師あり話者適応国際共著

井上勝喜, 原直, 阿部匡伸, 林知樹, 山本龍一, 渡部晋治

日本音響学会2020年春季研究発表会 2020年3月17日日本音響学会

　詳細を見る

開催年月日： 2020年3月16日 - 2020年3月18日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
ウェアラブルデバイスによる曖昧な入力からのニューラル機械翻訳を用いた日本語文章推定方式

渡邊淳,原直, 阿部匡伸

情報処理学会研究報告 2020年3月16日情報処理学会

　詳細を見る

開催年月日： 2020年3月16日 - 2020年3月17日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
End-to-End⾳声認識を⽤いたEnd-to-End⾳声合成の性能評価国際共著

井上勝喜, 原直, 阿部匡伸, 渡部晋治

第22回⽇本⾳響学会関⻄⽀部若⼿研究者交流研究発表会 2019年11月30日日本音響学会関西支部

　詳細を見る

開催年月日： 2019年11月30日

記述言語：日本語会議種別：ポスター発表

researchmap
DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients’ Speech

Hiroki Murakami, Sunao Hara, Masanobu Abe

APSIPA Annual Summit and Conference 2019 2019年11月19日 APSIPA

　詳細を見る

開催年月日： 2019年11月18日 - 2019年11月21日

記述言語：英語会議種別：口頭発表（一般）

開催地：Lanzhou, China

researchmap
Speech-like Emotional Sound Generator by WaveNet 国際会議

Kento Matsumoto, Sunao Hara, Masanobu Abe

APSIPA Annual Summit and Conference 2019 2019年11月 APSIPA

　詳細を見る

開催年月日： 2019年11月18日 - 2019年11月21日

記述言語：英語会議種別：口頭発表（一般）

開催地：Lanzhou, China

researchmap
WaveNet による言語情報を含まない感情音声合成方式における話者性の検討

松本剣斗, 原直, 阿部匡伸

日本音響学会2019年秋季研究発表会 2019年9月6日日本音響学会

　詳細を見る

開催年月日： 2019年9月4日 - 2019年9月6日

記述言語：日本語会議種別：口頭発表（一般）

開催地：立命館大BKCキャンパス（滋賀県草津市）

researchmap
新たにデザインされた人工舌と解剖学的人工舌の効果ならびにその選択基準

佐藤匡晃, 長塚弘亮, 川上滋央, 兒玉直紀, 原直, 阿部匡伸, 皆木省吾

日本補綴歯科学会中国・四国支部学術大会 2019年9月1日日本補綴歯科学会中国・四国支部

　詳細を見る

開催年月日： 2019年8月31日 - 2019年9月1日

記述言語：日本語会議種別：口頭発表（一般）

開催地：広島県福山市

researchmap
A signal processing perspective on human gait: Decoupling walking oscillations and gestures 国際共著国際会議

Adrien Gregorj, Zeynep Yücel, Sunao Hara, Akito Monden, Masahiro Shiomi

The 4th International Conference on Interactive Collaborative Robotics (ICR 2019) 2019年8月 SPECOM

　詳細を見る

開催年月日： 2019年8月20日 - 2019年8月25日

記述言語：英語会議種別：口頭発表（一般）

開催地：Istanbul, Turkey

researchmap
GPSデータに基づく日常生活における特別な行動の検出

小林誠,原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2019） 2019年7月4日情報処理学会

　詳細を見る

開催年月日： 2019年7月3日 - 2019年7月5日

記述言語：日本語会議種別：口頭発表（一般）

開催地：磐梯熱海温泉華の湯（福島県）

researchmap
CNN Autoencoder から抽出したボトルネック特徴量を用いた環境音分類

松原拓未, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2019） 2019年7月3日情報処理学会

　詳細を見る

開催年月日： 2019年7月3日 - 2019年7月5日

記述言語：日本語会議種別：口頭発表（一般）

開催地：磐梯熱海温泉華の湯（福島県）

researchmap
WaveNetによる言語情報を含まない感情音声合成方式の検討

松本剣斗, 原直, 阿部匡伸

音学シンポジウム2019 (SIG-MUS, SIG-SLP) 2019年6月23日情報処理学会

　詳細を見る

開催年月日： 2019年6月22日 - 2019年6月23日

記述言語：日本語会議種別：ポスター発表

開催地：京都大学吉田キャンパス（京都府）

researchmap
i-vectorに基づく賑わい音の推定方式の検討

呉セン陽, 朝田興平, 原直, 阿部匡伸

音学シンポジウム2019 (SIG-MUS, SIG-SLP) 2019年6月22日情報処理学会

　詳細を見る

開催年月日： 2019年6月22日 - 2019年6月23日

記述言語：日本語会議種別：ポスター発表

開催地：京都大学吉田キャンパス（京都府）

researchmap
舌亜全摘出者の音韻明瞭度改善のための Bidirectional LSTM-RNN に基づく音素補助情報を用いた声質変換方式の検討

村上博紀, 原直, 阿部匡伸

日本音響学会2019年春季研究発表会 2019年3月4日日本音響学会

　詳細を見る

開催年月日： 2019年3月3日 - 2019年3月5日

記述言語：日本語会議種別：ポスター発表

開催地：電気通信大学

researchmap
声質変換による舌亜全摘出者の音韻明瞭度改善のための音素補助情報の推定方式の検討

荻野聖也, 村上博紀, 原直, 阿部匡伸

日本音響学会2019年春季研究発表会 2019年3月4日日本音響学会

　詳細を見る

開催年月日： 2019年3月3日 - 2019年3月5日

記述言語：日本語会議種別：ポスター発表

開催地：電気通信大学

researchmap
DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

井上勝喜, 原直, 阿部匡伸, 井島勇祐

日本音響学会2019年春季研究発表会 2019年3月3日日本音響学会

　詳細を見る

開催年月日： 2019年3月3日 - 2019年3月5日

記述言語：日本語会議種別：ポスター発表

開催地：電気通信大学

researchmap
ながら聴き用楽曲の作業負荷に及ぼす影響とその選択方式の検討

高瀬郁, 阿部匡伸, 原直

第121回SIGMUS研究会 2018年11月21日情報処理学会

　詳細を見る

開催年月日： 2018年11月21日 - 2018年11月22日

記述言語：日本語会議種別：ポスター発表

開催地：ホテルこうしゅうえん（石川県輪島市）

researchmap
クラウドソーシングによる環境音マップ構築のための主観的な騒々しさ推定方式の検討

原直, 阿部匡伸

第17回情報科学技術フォーラム(FIT 2018) 2018年9月20日情報処理学会

　詳細を見る

開催年月日： 2018年9月19日 - 2018年9月21日

記述言語：日本語会議種別：口頭発表（一般）

開催地：福岡工業大学

researchmap
Speech Enhancement of Glossectomy Patient’s Speech using Voice Conversion Approach

Masanobu Abe, Seiya Ogino, Hiroki Murakami, Sunao Hara

日本生物物理学会第56回年会，シンポジウム：ヘルスシステムの理解と応用 2018年9月15日日本生物物理学会

　詳細を見る

開催年月日： 2018年9月15日 - 2018年9月17日

記述言語：英語会議種別：口頭発表（一般）

開催地：岡山大学津島キャンパス

researchmap
声質変換による舌亜全摘出者の音韻明瞭度改善のための補助情報の検討

村上博紀, 原直, 阿部匡伸

日本音響学会2018年秋季研究発表会 2018年9月12日日本音響学会

　詳細を見る

開催年月日： 2018年9月12日 - 2018年9月14日

記述言語：日本語会議種別：ポスター発表

開催地：大分大学旦野原キャンパス

researchmap
DNN音声合成における感情付与方式の評価

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会2018年秋季研究発表会 2018年9月12日日本音響学会

　詳細を見る

開催年月日： 2018年9月12日 - 2018年9月14日

記述言語：日本語会議種別：ポスター発表

開催地：大分大学旦野原キャンパス

researchmap
Naturalness Improvement Algorithm for Reconstructed Glossectomy Patient’s Speech Using Spectral Differential Modification in Voice Conversion

Hiroki Murakami, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

Interspeech 2018 2018年9月5日 ISCA

　詳細を見る

開催年月日： 2018年9月2日 - 2018年9月6日

記述言語：英語会議種別：ポスター発表

開催地：Hyderabad, India

researchmap
音声と口唇形状を用いた声質変換による舌亜全摘出者の音韻明瞭度改善の検討

荻野聖也, 村上博紀, 原直, 阿部匡伸

音声研究会 2018年6月28日電子情報通信学会

　詳細を見る

開催年月日： 2018年6月28日 - 2018年6月29日

記述言語：日本語会議種別：口頭発表（一般）

開催地：信州大学長野（工学）キャンパス

researchmap
舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

村上博紀,荻野聖也,原直,阿部匡伸,佐藤匡晃,皆木省吾

2018年日本音響学会春季研究発表会日本音響学会

　詳細を見る

開催年月日： 2018年3月13日 - 2018年3月15日

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
クラウドソーシングによる賑わい音識別方式のフィールド実験評価

朝田興平,原直,阿部匡伸

2018年日本音響学会春季研究発表会日本音響学会

　詳細を見る

開催年月日： 2018年3月13日 - 2018年3月15日

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
DNN音声合成における感情付与のための継続時間長モデルの検討

井上勝喜,原直,阿部匡伸,北条伸克,井島勇祐

2018年日本音響学会春季研究発表会日本音響学会

　詳細を見る

開催年月日： 2018年3月13日 - 2018年3月15日

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
Sound sensing using smartphones as a crowdsourcing approach

Sunao Hara, Asako Hatakeyama, Shota Kobayashi, Masanobu Abe

APSIPA Annual Summit and Conference 2017 2017年12月15日 APSIPA

　詳細を見る

開催年月日： 2017年12月12日 - 2017年12月15日

記述言語：英語会議種別：口頭発表（一般）

開催地：Kuala Lumpur, Malaysia

researchmap
An investigation to transplant emotional expressions in DNN-based TTS synthesis,

Katsuki Inoue, Sunao Hara, Masanobu Abe, Nobukatsu Hojo, Yusuke Ijima

APSIPA Annual Summit and Conference 2017 2017年12月14日 APSIPA

　詳細を見る

開催年月日： 2017年12月12日 - 2017年12月15日

記述言語：英語会議種別：ポスター発表

開催地：Kuala Lumpur, Malaysia

researchmap
New monitoring scheme for persons with dementia through monitoring-area adaptation according to stage of disease,

Shigeki Kamada, Yuji Matsuo, Sunao Hara, Masanobu Abe

ACM SIGSPATIAL Workshop on Recommendations for Location-based Services and Social Networks (LocalRec 2017) ACM

　詳細を見る

開催年月日： 2017年11月7日 - 2017年11月10日

記述言語：英語会議種別：ポスター発表

開催地：Redondo Beach, CA, USA

researchmap
DNN に基づく差分スペクトル補正を用いた声質変換による舌亜全摘出者の音韻明瞭性改善の検討

村上博紀, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

日本音響学会2017年秋季研究発表会 2017年9月26日日本音響学会

　詳細を見る

開催年月日： 2017年9月25日 - 2017年9月27日

記述言語：日本語会議種別：ポスター発表

開催地：愛媛大学城北キャンパス

researchmap
DNN による人間の感覚を考慮した騒々しさ推定方式に基づく騒音マップの作成

小林将大, 原直, 阿部匡伸

日本音響学会2017年秋季研究発表会 2017年9月26日日本音響学会

　詳細を見る

開催年月日： 2017年9月25日 - 2017年9月27日

記述言語：日本語会議種別：ポスター発表

開催地：愛媛大学城北キャンパス

researchmap
DNN音声合成における話者と感情の情報を扱うためのモデル構造の検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会2017年秋季研究発表会 2017年9月25日日本音響学会

　詳細を見る

開催年月日： 2017年9月25日 - 2017年9月27日

記述言語：日本語会議種別：ポスター発表

開催地：愛媛大学城北キャンパス

researchmap
Prediction of subjective assessments for a noise map using deep neural networks

Shota Kobayashi, Sunao Hara, Masanobu Abe

2017 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2017) 2017年9月13日 ACM

　詳細を見る

開催年月日： 2017年9月11日 - 2017年9月15日

記述言語：英語会議種別：ポスター発表

開催地：Maui, Hawaii, USA

researchmap
Speaker Dependent Approach for Enhancing a Glossectomy Patient's Speech via GMM-based Voice Conversion

Kei Tanaka, Sunao Hara, Masanobu Abe, Masaaki Sato, Shogo Minagi

Interspeech 2017 2017年8月23日 ISCA

　詳細を見る

開催年月日： 2017年8月20日 - 2017年8月24日

記述言語：英語会議種別：ポスター発表

開催地：Stockholm, Sweden

researchmap
環境音収集に効果的なインセンティブを与える可視化方式の検討

畠山晏彩子, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2017） 2017年6月28日情報処理学会

　詳細を見る

開催年月日： 2017年6月28日 - 2017年6月30日

記述言語：日本語会議種別：口頭発表（一般）

開催地：定山渓万世閣ホテルミリオーネ

researchmap
DNN音声合成における感情付与のためのモデル構造の検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

音声研究会 2017年6月22日電子情報通信学会

　詳細を見る

開催年月日： 2017年6月22日 - 2017年6月23日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東北大学片平キャンパス

researchmap
2つの粒度の生活圏に基づく見守りシステム

鎌田成紀, 原直, 阿部匡伸

電子情報通信学会総合大会 2017年3月22日電子情報通信学会

　詳細を見る

開催年月日： 2017年3月22日 - 2017年3月25日

記述言語：日本語会議種別：口頭発表（一般）

開催地：名城大学

researchmap
スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類

鳥羽隼司, 原直, 阿部匡伸

日本音響学会2017年春季研究発表会 2017年3月16日日本音響学会

　詳細を見る

開催年月日： 2017年3月15日 - 2017年3月17日

記述言語：日本語会議種別：ポスター発表

開催地：明治大学生田キャンパス

researchmap
DNNによる人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

小林将大, 原直, 阿部匡伸

日本音響学会2017年春季研究発表会 2017年3月16日日本音響学会

　詳細を見る

開催年月日： 2017年3月15日 - 2017年3月17日

記述言語：日本語会議種別：口頭発表（一般）

開催地：明治大学生田キャンパス

researchmap
Enhancing a Glossectomy Patient’s Speech via GMM-based Voice Conversion

Kei Tanaka, Sunao Hara, Masanobu Abe, Shogo Minagi

APSIPA Annual Summit and Conference 2016 2016年12月13日 APSIPA

　詳細を見る

開催年月日： 2016年12月13日 - 2016年12月16日

記述言語：英語会議種別：口頭発表（一般）

開催地：Jeju, Korea

researchmap
A classification method for crowded situation using environmental sounds based on Gaussian mixture model-universal background model

Tomoyasu Tanaka, Sunao Hara, Masanobu Abe

ASA/ASJ 5th Joint Meeting 2016年11月29日米国音響学会／日本音響学会

　詳細を見る

開催年月日： 2016年11月28日 - 2016年12月2日

記述言語：英語会議種別：ポスター発表

開催地：Honolulu, Hawaii

researchmap
基本周波数変形を考慮したスペクトル変換手法の検討

床建吾, 阿部匡伸, 原直

第18回IEEE広島支部学生シンポジウム（HISS 18th） 2016年11月19日 IEEE広島支部

　詳細を見る

開催年月日： 2016年11月19日 - 2016年11月20日

記述言語：日本語会議種別：ポスター発表

開催地：山口大学

researchmap
スマートフォンで収録した環境音に含まれるタップ音除去方式の検討

朝田興平, 原直, 阿部匡伸

日本音響学会2016年秋季研究発表会 2016年9月15日日本音響学会

　詳細を見る

開催年月日： 2016年9月14日 - 2016年9月16日

記述言語：日本語会議種別：ポスター発表

開催地：富山大学五福キャンパス

researchmap
重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討

原直, 田中智康, 阿部匡伸

日本音響学会2016年秋季研究発表会 2016年9月15日日本音響学会

　詳細を見る

開催年月日： 2016年9月14日 - 2016年9月16日

記述言語：日本語会議種別：口頭発表（一般）

開催地：富山大学五福キャンパス

researchmap
GMMに基づく声質変換を用いた舌亜全摘出者の音韻明瞭性改善の検討

田中慧, 原直, 阿部匡伸, 皆木省吾

日本音響学会2016年秋季研究発表会 2016年9月15日日本音響学会

　詳細を見る

開催年月日： 2016年9月14日 - 2016年9月16日

記述言語：日本語会議種別：口頭発表（一般）

開催地：富山大学五福キャンパス

researchmap
RNNによる実環境データからのマルチ音響イベント検出

鳥羽隼司, 原直, 阿部匡伸

日本音響学会2016年秋季研究発表会 2016年9月15日日本音響学会

　詳細を見る

開催年月日： 2016年9月14日 - 2016年9月16日

記述言語：日本語会議種別：ポスター発表

開催地：富山大学五福キャンパス

researchmap
LiBS: Lifelog browsing system to support sharing of memories

Atsuya Namba, Sunao Hara, Masanobu Abe

2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016) 2016年9月13日 ACM

　詳細を見る

開催年月日： 2016年9月12日 - 2016年9月16日

記述言語：英語会議種別：ポスター発表

開催地：Heidelberg, Germany

researchmap
Safety vs. Privacy: User Preferences from the Monitored and Monitoring Sides of a Monitoring System

Shigeki Kamada, Sunao Hara, Masanobu Abe

2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UniComp 2016) 2016年9月13日 ACM

　詳細を見る

開催年月日： 2016年9月12日 - 2016年9月16日

記述言語：英語会議種別：ポスター発表

開催地：Heidelberg, Germany

researchmap
主観的評価に基づいた騒音マップ構築のためのクラウドソーシングによる環境音収集システム

原直, 小林将大, 阿部匡伸

音声研究会 2016年8月25日電子情報通信学会

　詳細を見る

開催年月日： 2016年8月24日 - 2016年8月25日

記述言語：日本語会議種別：口頭発表（一般）

開催地：京都大学

researchmap
Sound collection systems using a crowdsourcing approach to construct sound map based on subjective evaluation

Sunao Hara, Shota Kobayashi, Masanobu Abe

IEEE ICME Workshop on Multimedia Mobile Cloud for Smart City Applications (MMCloudCity-2016) 2016年7月15日 IEEE

　詳細を見る

開催年月日： 2016年7月11日 - 2016年7月15日

記述言語：英語会議種別：口頭発表（一般）

開催地：Seattle, WA, USA

researchmap
GPSデータ匿名化レベルの主観的許容度を客観的に表現する指標の検討

三藤優介, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2016） 2016年7月7日情報処理学会

　詳細を見る

開催年月日： 2016年7月6日 - 2016年7月8日

記述言語：日本語会議種別：口頭発表（一般）

開催地：鳥羽シーサイドホテル

researchmap
人間の感覚を考慮した騒音マップ作成のための騒々しさ推定方式

小林将大, 原直, 阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2016） 2016年7月6日情報処理学会

　詳細を見る

開催年月日： 2016年7月6日 - 2016年7月8日

記述言語：日本語会議種別：口頭発表（一般）

開催地：鳥羽シーサイドホテル

researchmap
滞在地ネットワークに基づく滞在地間の移動傾向を表現する尺度の検討

大藤高史, 原直, 阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 2016年5月13日電子情報通信学会

　詳細を見る

開催年月日： 2016年5月12日 - 2016年5月13日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京大学

researchmap
賑わい度推定のための環境音データベースの構築

田中智康,原直,阿部匡伸

2016年日本音響学会春季研究発表会 2016年3月11日日本音響学会

　詳細を見る

開催年月日： 2016年3月9日 - 2016年3月11日

記述言語：日本語会議種別：ポスター発表

開催地：桐蔭横浜大学

researchmap
生活圏を応用したプライバシーに配慮可能な見守り方式の検討

鎌田成紀,原直,阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 (LOIS) 2016年1月21日電子情報通信学会

　詳細を見る

開催年月日： 2016年1月21日 - 2016年1月22日

記述言語：日本語会議種別：口頭発表（一般）

開催地：福岡工業大学

researchmap
A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding

Masaki Yamaoka, Sunao Hara, Masanobu Abe

APSIPA Annual Summit and Conference 2015 2015年12月19日 APSIPA

　詳細を見る

開催年月日： 2015年12月16日 - 2015年12月19日

記述言語：英語会議種別：口頭発表（一般）

開催地：Hong Kong

researchmap
環境音検出器を用いた環境音の可視化に関する検討

田中智康,原直,阿部匡伸

第17回IEEE広島支部学生シンポジウム（HISS 17th） IEEE広島支部

　詳細を見る

開催年月日： 2015年11月21日 - 2015年11月22日

記述言語：日本語会議種別：ポスター発表

開催地：岡山大学

researchmap
心地よく話すことができる聞き役音声対話システムのための対話戦略

齊藤椋太,原直,阿部匡伸

第17回IEEE広島支部学生シンポジウム（HISS 17th） IEEE広島支部

　詳細を見る

開催年月日： 2015年11月21日 - 2015年11月22日

記述言語：日本語会議種別：ポスター発表

開催地：岡山大学

researchmap
クラウドソーシングによる環境音収集システムを用いた予備収録実験

原直,阿部匡伸,曽根原登

2015年日本音響学会秋季研究発表会 2015年9月18日日本音響学会

　詳細を見る

開催年月日： 2015年9月16日 - 2015年9月18日

記述言語：日本語会議種別：ポスター発表

開催地：会津大学

researchmap
冗長なシステム応答を用いたユーザの誤認識に頑健な音声対話システムに関する検討

山岡将綺,原直,阿部匡伸

2015年日本音響学会秋季研究発表会 2015年9月18日日本音響学会

　詳細を見る

開催年月日： 2015年9月16日 - 2015年9月18日

記述言語：日本語会議種別：ポスター発表

開催地：会津大学

researchmap
音楽を用いた生活収録音の振り返り手法の検討

鳥羽隼司,原直,阿部匡伸

2015年日本音響学会秋季研究発表会 2015年9月17日日本音響学会

　詳細を見る

開催年月日： 2015年9月16日 - 2015年9月18日

記述言語：日本語会議種別：口頭発表（一般）

開催地：会津大学

researchmap
A Sub-Band Text-to-Speech by Combining Sample-Based Spectrum with Statistically Generated Spectrum

Tadashi Inai, Sunao Hara, Masanobu Abe, Yusuke Ijima, Noboru Miyazaki and Hideyuki Mizuno

Interspeech 2015 ISCA

　詳細を見る

開催年月日： 2015年9月6日 - 2015年9月10日

記述言語：英語会議種別：ポスター発表

開催地：Dresden, Germany

researchmap
Algorithm to estimate a living area based on connectivity of places with home

Yuji Matsuo, Sunao Hara, Masanobu Abe

HCI International 2015

　詳細を見る

開催年月日： 2015年8月2日 - 2015年8月7日

記述言語：英語会議種別：ポスター発表

開催地：Los Angels, CA, USA

researchmap
Extraction of key segments from day-long sound data

Akinori Kasai, Sunao Hara, Masanobu Abe

HCI International 2015

　詳細を見る

開催年月日： 2015年8月2日 - 2015年8月7日

記述言語：英語会議種別：ポスター発表

開催地：Los Angels, CA, USA

researchmap
LiBS:発見と気付きを可能とするライフログブラウジング方式

難波敦也, 原直,阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2015） 2015年7月10日

　詳細を見る

開催年月日： 2015年7月8日 - 2015年7月10日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岩手県安比高原

researchmap
長期取得音からライフログとして残したい音の抽出方法

笠井昭範,原直,阿部匡伸

マルチメディア，分散，協調とモバイルシンポジウム（DICOMO2015） 2015年7月10日

　詳細を見る

開催年月日： 2015年7月8日 - 2015年7月10日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岩手県安比高原

researchmap
振り返り支援における効率的な映像要約のための自動収集ライフログ活用法

大西杏菜,原直,阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 (LOIS) 電子情報通信学会

　詳細を見る

開催年月日： 2015年5月14日 - 2015年5月15日

記述言語：日本語会議種別：口頭発表（一般）

開催地：津田塾大学小平キャンパス

researchmap
Sound collection and visualization system enabled participatory and opportunistic sensing approaches

Sunao Hara, Masanobu Abe, Noboru Sonehara

2nd International Workshop on Crowd Assisted Sensing, Pervasive Systems and Communications (CASPer 2015) IEEE

　詳細を見る

開催年月日： 2015年3月27日

記述言語：英語会議種別：口頭発表（一般）

開催地：St. Louis, Missouri, USA

researchmap
ミックスボイスの地声・裏声との類似度比較

家村朋典,原直,阿部匡伸

2015年日本音響学会春季研究発表会 2015年3月17日日本音響学会

　詳細を見る

開催年月日： 2015年3月16日 - 2015年3月18日

記述言語：日本語会議種別：ポスター発表

開催地：日本大学理工学部

researchmap
聴取者の主観評価に基づく音地図作成のための環境音収録

原直,阿部匡伸,曽根原登

2015年日本音響学会春季研究発表会 2015年3月17日日本音響学会

　詳細を見る

開催年月日： 2015年3月16日 - 2015年3月18日

記述言語：日本語会議種別：口頭発表（一般）

開催地：日本大学理工学部

researchmap
高域部への素片スペクトルとHMM生成スペクトルの導入によるHMM合成音声の品質改善の検討

稻井禎,原直,阿部匡伸,井島勇祐,宮崎昇,水野秀之

2015年日本音響学会春季研究発表会 2015年3月17日日本音響学会

　詳細を見る

開催年月日： 2015年3月16日 - 2015年3月18日

記述言語：日本語会議種別：ポスター発表

開催地：日本大学理工学部

researchmap
移動経路のパターン分類による人の行動分析

瀬藤諒,原直,阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 (LOIS) 電子情報通信学会

　詳細を見る

開催年月日： 2015年3月5日 - 2015年3月6日

記述言語：日本語会議種別：口頭発表（一般）

開催地：沖縄科学技術大学院大学

researchmap
滞在地の特徴量を利用した「特別な日」検索方式

林啓吾,原直,阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 (LOIS) 電子情報通信学会

　詳細を見る

開催年月日： 2015年3月5日 - 2015年3月6日

記述言語：日本語会議種別：口頭発表（一般）

開催地：沖縄科学技術大学院大学

researchmap
滞在地と経路に着目した生活圏抽出法

松尾雄二,原直,阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会 (LOIS) 電子情報通信学会

　詳細を見る

開催年月日： 2015年3月5日 - 2015年3月6日

記述言語：日本語会議種別：口頭発表（一般）

開催地：沖縄科学技術大学院大学

researchmap
クラウドセンシングデータによる地域の賑わい分析 -地域経済活性化-

原直

第7回国際ワークショップ「社会イノベーションを誘発する情報・システム」国立情報学研究所

　詳細を見る

開催年月日： 2015年2月16日 - 2015年2月17日

記述言語：日本語会議種別：口頭発表（招待・特別）

開催地：国立情報学研究所

researchmap
Extracting Daily Patterns of Human Activity Using Non-Negative Matrix Factorization

Masanobu Abe, Akihiko Hirayama, Sunao Hara

IEEE International Conference on Consumer Electronics IEEE

　詳細を見る

開催年月日： 2015年1月9日 - 2015年1月12日

記述言語：英語会議種別：口頭発表（一般）

開催地：Las Vegas, USA

researchmap
発話への関心の有無判別における聞き手の判別基準の有効性

齊藤椋太, 原直, 阿部匡伸

第17回日本音響学会関西支部若手研究者交流研究発表会日本音響学会関西支部

　詳細を見る

開催年月日： 2014年12月14日

記述言語：日本語会議種別：ポスター発表

開催地：関西大学

researchmap
ロック歌唱における「歪み声」と「ミックスボイス」の音響的特徴分析

家村朋典,原直,阿部匡伸

第17回日本音響学会関西支部若手研究者交流研究発表会日本音響学会関西支部

　詳細を見る

開催年月日： 2014年12月14日

記述言語：日本語会議種別：ポスター発表

開催地：関西大学

researchmap
A Hybrid Text-to-Speech Based on Sub-Band Approach

Takuma Inoue, Sunao Hara, Masanobu Abe

Asia-Pacific Signal and Information Processing Association 2014 Annual Summit and Conference (APSIPA ASC 2014) Asia-Pacific Signal and Information Processing Association (APSIPA)

　詳細を見る

開催年月日： 2014年12月9日 - 2014年12月12日

記述言語：英語会議種別：ポスター発表

開催地：Cambodia

researchmap
音素波形選択型音声合成方式に用いるデータベースサイズと主観評価との関係分析

稻井禎, 原直, 阿部匡伸

2014年日本音響学会秋季研究発表会日本音響学会

　詳細を見る

開催年月日： 2014年9月3日 - 2014年9月5日

記述言語：日本語会議種別：ポスター発表

開催地：北海学園大学

researchmap
クラウドセンシングにより収集された環境音のシンボル表現を用いた音地図構築手法

原直, 阿部匡伸, 曽根原登

2014年日本音響学会秋季研究発表会日本音響学会

　詳細を見る

開催年月日： 2014年9月3日 - 2014年9月5日

記述言語：日本語会議種別：口頭発表（一般）

開催地：北海学園大学

researchmap
FLAG: 位置情報を基軸としたライフログ集約システム

笠井昭範, 原直, 阿部匡伸

ユビキタスコンピューティングシステム研究会情報処理学会

　詳細を見る

開催年月日： 2014年6月28日 - 2014年6月29日

記述言語：日本語会議種別：口頭発表（一般）

開催地：国立情報学研究所

researchmap
GPSデータから構築したネットワーク構造におけるノード次数に基づく行動分析法の検討

藤岡大輔, 原直, 阿部匡伸

ユビキタスコンピューティングシステム研究会情報処理学会

　詳細を見る

開催年月日： 2014年5月29日 - 2014年5月30日

記述言語：日本語会議種別：口頭発表（一般）

開催地：富山国際会議場

researchmap
スマートデバイスを用いたクラウドソーシングによる環境音収集システムの開発

原直,笠井昭範,阿部匡伸,曽根原登

音声研究会（音学シンポジウム2014）電子情報通信学会

　詳細を見る

開催年月日： 2014年5月24日 - 2014年5月25日

記述言語：日本語会議種別：ポスター発表

開催地：日本大学文理学部キャンパス百周年記念館

researchmap
車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討

山岡将綺, 原直, 阿部匡伸

音声言語処理研究会情報処理学会

　詳細を見る

開催年月日： 2014年5月22日 - 2014年5月23日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京工業大学大岡山キャンパス

researchmap
非負値行列因子分解によるPC操作ログからの勤務パタン抽出

平山明彦, 原直, 阿部匡伸

ライフインテリジェンスとオフィス情報システム研究会電子情報通信学会

　詳細を見る

開催年月日： 2014年5月15日 - 2014年5月16日

記述言語：日本語会議種別：口頭発表（一般）

開催地：早稲田大学西早稲田キャンパス

researchmap
クラウドソーシングによる環境音収集

原直

第15回岡山情報通信技術研究会岡山情報通信技術研究会

　詳細を見る

開催年月日： 2014年4月30日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
New Approach to Emotional Information Exchange: Experience Metaphor Based on Life Logs

Masanobu Abe, Daisuke Fujioka, Kazuto Hamano, Sunao Hara, Rika Mochizuki, Tomoki Watanabe

The 12th IEEE International Conference on Pervasive Computing and Communications (PerCom 2014) IEEE

　詳細を見る

開催年月日： 2014年3月24日 - 2014年3月28日

記述言語：英語会議種別：ポスター発表

開催地：Budapest, Hungary

researchmap
他人との行動ログ比較による個人の行動特徴分析

瀬藤諒, 阿部匡伸, 原直

電子情報通信学会2014年総合大会電子情報通信学会

　詳細を見る

開催年月日： 2014年3月18日 - 2014年3月21日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
滞在地と経路に着目した生活圏抽出法の検討

松尾雄二,原直,阿部匡伸

情報処理学会第76回全国大会 2014年

　詳細を見る

開催年月日： 2014年3月11日 - 2014年3月13日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京電機大学

researchmap
滞在地の特徴量を利用した「特別な日」検索方式の検討

林啓吾,原直,阿部匡伸

情報処理学会第76回全国大会 2014年

　詳細を見る

開催年月日： 2014年3月11日 - 2014年3月13日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京電機大学

researchmap
音声波形の高域利用による HMM 音声合成方式の評価

井上拓真,原直,阿部匡伸,井島勇祐,水野秀之

2014年日本音響学会春季研究発表会 2014年

　詳細を見る

開催年月日： 2014年3月10日 - 2014年3月12日

記述言語：日本語会議種別：口頭発表（一般）

開催地：日本大学

researchmap
クラウドソーシングによる環境音収集のためのスマートデバイス用アプリケーションの開発

原直,笠井昭範,阿部匡伸,曽根原登

電子情報通信学会 LOIS研究会 2014年

　詳細を見る

開催年月日： 2014年3月7日 - 2014年3月8日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
地理情報を活用したモバイル音声対話システムに関する研究

原直

情報処理学会音声言語処理研究会（SIG–SLP第100回シンポジウム）

　詳細を見る

開催年月日： 2014年1月31日 - 2014年2月1日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
PC操作ログから抽出したソフトウェアの使用様態による働き方の分析

平山明彦,原直,阿部匡伸

第15回IEEE広島支部学生シンポジウム（HISS 15th） 2013年

　詳細を見る

開催年月日： 2013年11月

記述言語：日本語会議種別：ポスター発表

開催地：鳥取大学

researchmap
GPSデータの滞在地に着目した行動振り返り支援方式

林啓吾,原直,阿部匡伸

平成25年度（第64回）電気・情報関連学会中国支部連合大会

　詳細を見る

開催年月日： 2013年10月19日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
位置情報による行動分析を行うための経由地検出の検討

瀬藤諒,原直,阿部匡伸

平成25年度（第64回）電気・情報関連学会中国支部連合大会

　詳細を見る

開催年月日： 2013年10月19日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
GPSデータを用いた生活圏の動的生成のためのデータ量に関する検討

松尾雄二,原直,阿部匡伸

平成25年度（第64回）電気・情報関連学会中国支部連合大会

　詳細を見る

開催年月日： 2013年10月19日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
混合正規分布を用いた声質変換法における分布数とスペクトル変換精度との関係性の検討

遠藤一輝,原直,阿部匡伸

平成25年度（第64回）電気・情報関連学会中国支部連合大会

　詳細を見る

開催年月日： 2013年10月19日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
スペクトル包絡と基本周波数の変換が音声の個人性に与える影響の検討

河井啓介, 原直, 阿部匡伸

2013年日本音響学会秋季研究発表会日本音響学会

　詳細を見る

開催年月日： 2013年9月25日 - 2013年9月27日

記述言語：日本語会議種別：ポスター発表

開催地：豊橋技術科学大学

researchmap
音声波形の高域利用によるHMM音声合成の高品質化

井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

2013年日本音響学会秋季研究発表会

　詳細を見る

開催年月日： 2013年9月25日 - 2013年9月27日

記述言語：日本語会議種別：ポスター発表

researchmap
音響信号とマルチセンサー信号を利用したスマートフォンによる自動車の燃費推定

難波祥平,原直,阿部匡伸

音声研究会電子情報通信学会／日本音響学会

　詳細を見る

開催年月日： 2013年5月16日 - 2013年5月17日

記述言語：日本語会議種別：口頭発表（一般）

開催地：岡山大学

researchmap
音声情報案内システムにおけるBag-of-Wordsを用いた無効入力棄却モデルの可搬性の評価

真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

日本音響学会 2013年春季研究発表会日本音響学会

　詳細を見る

開催年月日： 2013年3月13日 - 2013年3月15日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京工科大学

researchmap
HMM音声合成と波形音声合成の混在による方式の評価

井上拓真, 原直, 阿部匡伸, 井島勇祐, 水野秀之

日本音響学会 2013年春季研究発表会日本音響学会

　詳細を見る

開催年月日： 2013年3月13日 - 2013年3月15日

記述言語：日本語会議種別：口頭発表（一般）

開催地：東京工科大学

researchmap
GPSデータから抽出した滞在地のネットワークにおける個人の特徴分析

藤岡大輔, 原直, 阿部匡伸

電子情報通信学会ライフインテリジェンスとオフィス情報システム研究会（ＬＯＩＳ）電子情報通信学会

　詳細を見る

開催年月日： 2013年3月7日 - 2013年3月8日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
他者のライフログからの類似した印象を持つイベント抽出法の検討

濱野和人, 原直, 阿部匡伸, 藤岡大輔, 望月理香, 渡部智樹

電子情報通信学会ライフインテリジェンスとオフィス情報システム研究会（ＬＯＩＳ）電子情報通信学会

　詳細を見る

開催年月日： 2013年3月7日 - 2013年3月8日

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Bag-of-Wordsを用いた音声情報案内システム無効入力棄却モデルの可搬性の評価

真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

第15回日本音響学会関西支部若手研究者交流研究発表会日本音響学会関西支部

　詳細を見る

開催年月日： 2012年12月9日

記述言語：日本語会議種別：ポスター発表

researchmap
Development of a toolkit handling multiple speech-oriented guidance agents for mobile applications

Sunao Hara, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano

The 4th International Workshop on Spoken Dialog Systems (IWSDS2012)

　詳細を見る

開催年月日： 2012年11月28日 - 2012年11月30日

記述言語：英語会議種別：ポスター発表

開催地：Paris, France

researchmap
Evaluation of invalid input discrimination using BOW for speech-oriented guidance system

Haruka Majima, Rafael Torres, Hiromichi Kawanami, Sunao Hara, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano

The 4th International Workshop on Spoken Dialog Systems (IWSDS2012)

　詳細を見る

開催年月日： 2012年11月28日 - 2012年11月30日

記述言語：英語会議種別：ポスター発表

開催地：Paris, France

researchmap
音声情報システムにおける最大エントロピー法を用いた無効入力棄却の評価

真嶋温佳, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏

日本音響学会 2012年秋季研究発表会日本音響学会

　詳細を見る

開催年月日： 2012年9月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討

原直,川波弘道,猿渡洋,鹿野清宏

音声言語処理研究会 2012年情報処理学会

　詳細を見る

開催年月日： 2012年7月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
クラウド時代の新しい音声研究パラダイム

秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原直,堀貴明

音声言語処理研究会 2012年情報処理学会

　詳細を見る

開催年月日： 2012年7月

記述言語：日本語会議種別：シンポジウム・ワークショップパネル（指名）

researchmap
音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却

真嶋温佳,トーレス・ラファエル,川波弘道,原直,松井知子,猿渡洋,鹿野清宏

音声言語処理研究会 2012年情報処理学会

　詳細を見る

開催年月日： 2012年7月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Causal analysis of task completion erros in spoken music retrieval interactions

Sunao Hara, Norihide Kitaoka, Kazuya Takeda

LREC 2012 2012年 ELDA

　詳細を見る

開催年月日： 2012年5月

記述言語：英語会議種別：ポスター発表

開催地：Istanbul, Turkey

researchmap
Multi-band speech recognition using band-dependent confidence measures of blind source separation

Atsushi Ando, Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

The Acoustics 2012 2012年

　詳細を見る

開催年月日： 2012年5月

記述言語：英語会議種別：ポスター発表

開催地：Hong Kong

researchmap
携帯端末用音声情報案内システムのためのマイク入力に関する調査

中清行,原直,川波弘道,猿渡洋,鹿野清宏

電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション 2012年電子情報通信学会

　詳細を見る

開催年月日： 2012年3月

記述言語：日本語会議種別：ポスター発表

researchmap
周波数帯域ごとの音源分離信頼度を利用したマルチバンド音声認識

安藤厚志,大橋宏正,原直,北岡教英,武田一哉

2012年春季研究発表会 2012年日本音響学会

　詳細を見る

開催年月日： 2012年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
多様な利用環境における音声情報案内サービスソフトウェアの開発

原直,川波弘道,猿渡洋,鹿野清宏

電子情報通信学会総合大会 2012年電子情報通信学会

　詳細を見る

開催年月日： 2012年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
ブラインド音源分離の信頼度を用いたマルチバンド音声認識

安藤厚志,大橋宏正,原直,北岡教英,武田一哉

音声研究会 2012年電子情報通信学会

　詳細を見る

開催年月日： 2012年2月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation

Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

ASRU 2011 2011年 IEEE

　詳細を見る

開催年月日： 2011年12月

記述言語：英語会議種別：ポスター発表

開催地：Hawaii

researchmap
Training Robust Acoustic Models Using Features of Pseudo-Speakers Generated by Inverse CMLLR Transformations

Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda

APSIPA-ASC 2011 2011年 APSIPA

　詳細を見る

開催年月日： 2011年10月

記述言語：英語会議種別：ポスター発表

開催地：Xi'an, China

researchmap
On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors

Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

IWSDS 2011 2011年

　詳細を見る

開催年月日： 2011年9月

記述言語：英語会議種別：ポスター発表

開催地：Granada, Spain

researchmap
Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems

Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

Interspeech 2011 2011年 ISCA

　詳細を見る

開催年月日： 2011年8月

記述言語：英語会議種別：ポスター発表

開催地：Florence, Italy

researchmap
Music recommendation system based on human-to-human conversation recognition

Hiromasa OHASHI, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

HCIAmI'11 2011年

　詳細を見る

開催年月日： 2011年7月

記述言語：英語会議種別：口頭発表（一般）

開催地：Nottingham, U.K.

researchmap
雑談音声の認識に基づく楽曲連想再生システム

大橋宏正,原直,北岡教英,武田一哉

2011年春季研究発表会 2011年日本音響学会

　詳細を見る

開催年月日： 2011年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
MLLR変換行列に基づいた音響特徴量生成による音響モデル学習

伊藤新,原直,北岡教英,武田一哉

2011年春季研究発表会 2011年日本音響学会

　詳細を見る

開催年月日： 2011年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
音声対話システムにおける発話・行動タグN-gram を用いた課題未達成対話の検出手法と分析

原直,北岡教英,武田一哉

2011年春季研究発表会 2011年日本音響学会

　詳細を見る

開催年月日： 2011年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル

伊藤新,北岡教英,原直,武田一哉

音声言語シンポジウム 2010年情報処理学会

　詳細を見る

開催年月日： 2010年12月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
雑談音声の常時認識による楽曲提案システム

大橋宏正,北岡教英,原直,武田一哉

音声研究会 2010年電子情報通信学会

　詳細を見る

開催年月日： 2010年10月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Automatic detection of task-incompleted dialog for spoken dialog system based on dialog act N-gram

Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

INTERSPEECH2010 2010年9月 ISCA

　詳細を見る

開催年月日： 2010年9月

記述言語：英語会議種別：ポスター発表

開催地：Makuhari, Japan

researchmap
音声対話システムの発話系列N-gram を用いた課題未達成対話のオンライン検出

原直,北岡教英,武田一哉

2011年秋季研究発表会 2010年日本音響学会

　詳細を見る

開催年月日： 2010年9月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Rapid acoustic model adaptation using inverse MLLR-based feature generation

Arata ITO, Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

The 20th International Congress on Acoustics (ICA2010) 2010年8月

　詳細を見る

開催年月日： 2010年8月

記述言語：英語会議種別：ポスター発表

開催地：Sydney, Australia

researchmap
Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system

Sunao HARA, Norihide KITAOKA, Kazuya TAKEDA

7th conference on International Language Resources and Evaluation (LREC'10) 2010年5月 ELDA

　詳細を見る

開催年月日： 2010年5月

記述言語：英語会議種別：口頭発表（一般）

開催地：Valleta, Malta

researchmap
MLLR 変換行列により生成した音声特徴量に基づく高速モデル適応

伊藤新,原直,北岡教英,武田一哉

2011年秋季研究発表会 2010年日本音響学会

　詳細を見る

開催年月日： 2010年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
楽曲連想再生のための文書特徴量と音響特徴量の対応付け

高橋量衛, 大石康智, 原直, 北岡教英, 武田一哉

第4回音声ドキュメント処理ワークショップ 2010年

　詳細を見る

開催年月日： 2010年2月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法

原直,北岡教英,武田一哉

音声言語シンポジウム 2009年情報処理学会

　詳細を見る

開催年月日： 2009年12月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
複数音響モデルからの最適選択による音声認識

伊藤新,原直,宮島千代美,北岡教英,武田一哉

平成21年度電気関係学会東海支部連合大会 2009年

　詳細を見る

開催年月日： 2009年9月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
楽曲間の主観的類似度と音響的類似度との関連付けに関する検討

平賀悠介,大石康智,原直,武田一哉

2009年秋季研究発表会 2009年日本音響学会

　詳細を見る

開催年月日： 2009年9月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
音声対話システムのユーザ満足度推論におけるネットワークモデルの構築と評価

原直,北岡教英,武田一哉

2009年春季研究発表会 2009年日本音響学会

　詳細を見る

開催年月日： 2009年3月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
音声認識システムの満足度評価におけるユーザモデル

原直,北岡教英,武田一哉

音声言語シンポジウム 2008年情報処理学会

　詳細を見る

開催年月日： 2008年12月

記述言語：日本語会議種別：口頭発表（一般）

researchmap
Data collection and usability study of a PC-based speech application in various user environments

Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

Oriental-COCOSDA 2008 2008年11月

　詳細を見る

開催年月日： 2008年11月

記述言語：英語会議種別：口頭発表（一般）

開催地：Kyoto, Japan

researchmap
In-car speech data collection along with various multimodal signals

Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda

The 6th International Language Resources and Evaluation (LREC08) 2008年5月 ELDA

　詳細を見る

開催年月日： 2008年5月

記述言語：英語会議種別：口頭発表（一般）

開催地：Marrakech Morocco

researchmap
DNN-based Voice Conversion with Auxiliary Phonemic Information to Improve Intelligibility of Glossectomy Patients' Speech 国際会議

Hiroki Murakami, Sunao Hara, Masanobu Abe

APSIPA Annual Summit and Conference 2019 2019年11月 APSIPA

　詳細を見る

記述言語：英語会議種別：口頭発表（一般）

開催地：Lanzhou, China

researchmap
舌亜全摘出者の音韻明瞭性改善のためのマルチモーダルデータベースの構築

村上博紀, 荻野聖也, 原直, 阿部匡伸, 佐藤匡晃, 皆木省吾

日本音響学会2018年春季研究発表会 2018年3月26日日本音響学会

　詳細を見る

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
クラウドソーシングによる賑わい音識別方式のフィールド実験評価

朝田興平, 原直, 阿部匡伸

日本音響学会2018年春季研究発表会 2018年3月25日日本音響学会

　詳細を見る

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
DNN音声合成における感情付与のための継続時間長モデルの検討

井上勝喜, 原直, 阿部匡伸, 北条伸克, 井島勇祐

日本音響学会2018年春季研究発表会 2018年3月25日日本音響学会

　詳細を見る

記述言語：日本語会議種別：ポスター発表

開催地：日本工業大学宮代キャンパス

researchmap
An online customizable music retrieval system with a spoken dialogue interface

Sunao Hara, Chiyomi Miyajima, Katsunobu Itou, Kazuya Takeda

4th Joint Meeting of ASA/ASJ 2006年11月

　詳細を見る

記述言語：英語会議種別：ポスター発表

researchmap
Preliminary Study of a Learning Effect on Users to Develop a New Evaluation of the Spoken Dialogue System

Sunao Hara, Ayako Shirose, Chiyomi Miyajima, Katsunobu Ito, Kazuya Takeda

Oriental-COCOSDA 2005 2005年12月

　詳細を見る

記述言語：英語会議種別：口頭発表（一般）

researchmap

▼全件表示

Works（作品等）

ChartEx

原直

2017年5月

　詳細を見る

作品分類：ソフトウェア発表場所：GitHub

Excel Addin for export chart as image file such as png, jpeg, and pdf.

researchmap
オトログマッパー

原直

2014年

-

2016年

　詳細を見る

作品分類：ソフトウェア発表場所：Google Play

研究用に作成した Android アプリケーション

researchmap
TTX KanjiMenu Plugin

原直

2007年3月

　詳細を見る

作品分類：ソフトウェア

Tera Termでサーバで利用する漢字コードの選択をメニューから選択できるようにするためのプラグインです。現在は、Sourceforge.jpのTera Termプロジェクトによってメンテナンスがなされています。

researchmap
Pocket Julius

原直

2003年1月

　詳細を見る

作品分類：ソフトウェア

このパッケージは大語彙音声認識デコーダ Julius を Microsoft Pocket PC 2002 環境で動くようにした Pocket Julius のデモパッケージです．

researchmap

受賞

学会活動貢献賞

2023年3月日本音響学会

　詳細を見る

researchmap
教育貢献賞

2022年3月岡山大学工学部実験・演習科目における音声配信環境の構築

原直, 右田剛史

　詳細を見る

researchmap
教育貢献賞

2022年3月岡山大学工学部教育用計算機システムの充実に関する貢献

乃村能成, 上野史, 原直, 渡邊誠也

　詳細を見る

researchmap
社会貢献賞

2021年3月岡山大学工学部

　詳細を見る

researchmap
ベストティーチャー賞

2020年3月岡山大学工学部

　詳細を見る

researchmap
教育貢献賞

2019年3月岡山大学工学部

原直

　詳細を見る

researchmap
学会活動貢献賞

2019年3月日本音響学会

原直

　詳細を見る

researchmap
FIT奨励賞

2018年9月第17回情報科学技術フォーラム

原直

　詳細を見る

researchmap
優秀論文賞

2016年8月情報処理学会 DICOMO2016

小林将大, 原直, 阿部匡伸

　詳細を見る

researchmap
教育貢献賞

2016年3月岡山大学工学部

原直

　詳細を見る

researchmap
平成25年度岡山工学振興会科学技術賞

2013年7月公益財団法人岡山工学振興会

原直

　詳細を見る

researchmap
平成16年秋季研究発表会ポスター賞

2004年9月日本音響学会

原直

　詳細を見る

researchmap

▼全件表示

共同研究・競争的資金等の研究

コンセプト・ドリフトを考慮して環境音から観光地の雰囲気推定する機械学習方式の研究

研究課題/領域番号：23K11335 2023年04月 - 2027年03月

日本学術振興会科学研究費助成事業基盤研究(C)

原直

　詳細を見る

配分額：4680000円（直接経費：3600000円、間接経費：1080000円）

researchmap
協調的ライブ記録が支えるアクティブラーニング＠オンラインの技術研究

研究課題/領域番号：21K12155 2021年04月 - 2024年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

西村竜一, 原直

　詳細を見る

担当区分：研究分担者

配分額：4030000円（直接経費：3100000円、間接経費：930000円）

本研究では、アクティブラーニングをオンライン展開するために必要となる要素技術開発を行う。特に、グループワークをオンラインで実施することを想定し、学生と学生、学生と指導者、指導者と指導者の間の意思疎通を支援する技術を開発する。
利用者に適応可能なフレキシブルなインタフェースを実現するため、話者判別法の検討を行った。特に、若年話者判別タスクに深層学習を適用し、異なる分類モデルの検証を行った。データセットには、クラウドソーシングで収集したオンライン実環境発話を使用した。
オンラインでの意思疎通の際に、度々問題となる話者の早口の可視化手法を検討した。自動音声認識を応用して、単位時間あたりの発話文字数（発話速度）の計測を試みたが、早口の検出部分と聴講者が早口と感じるタイミングが異なることがあることを確認した。複数の自動音声認識エンジンを併用した実験では、人手で書き起こした正確な場合よりも自動音声認識の出力文字数が少なくなる傾向があった。この減少を早口の可視化のファクタとして利用することを検討した。
音声と映像の併用特徴量を用いて、議論の様子の評価手法を検討した。音と画像を併用することで識別率の改善傾向が得られた。音響信号が取得できない場合でも、画像中の人の動きから判定できることがあることを確認した。多様な情報源から、適切な特徴量を見出す方式について、さらに検討する。
敵対的生成ネットワークを用いた話者匿名化手法の検証を行った。匿名化処理後の音声に対し、自然性と話者認識可能性、話者弁別可能性を調査した。自然性について、従来法と比較してスコアの改善を得た。処理後音声からの話者特定は困難であることを確認した。話者弁別正解率から、処理後音声間の話者弁別は可能であることが示された。

researchmap
感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

研究課題/領域番号：21K11963 2021年04月 - 2024年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

阿部匡伸, 原直

　詳細を見る

担当区分：研究分担者

配分額：4160000円（直接経費：3200000円、間接経費：960000円）

研究計画調書に記載した課題に関して，令和３年度（２０２１年度）に実施した内容は下記の通り。
（課題１）非言語情報の表現モデル「①-１感情表現モデルの検討」については，話者性を制御できるように補助情報として話者IDを加えるとともに，感情の強さを感情IDのone-hotベクトルの重みによって合成時に制御できるようにモデル構造を改良した。「①-２感情強度表現方式の検討」についてはMOSテストによって感情の強さ制御性能を評価した。評価実験から感情IDの操作によって，“Happy”は感情の強さを制御可能であることが示された．一方，“Angry”は感情の強さが“Happy”ほど適切に制御できなかった。分析の結果， “Angry”は“Normal”に類似した音響パラメータ特徴となっており，今回の実験に使用した“Angry”データは細かな操作が難しい音声であることが明らかとなった。「①-３話者性の多様化への適用」については, ABX テストにより合成音声の話者性を評価した。Xとして自然音声か合成音声のどちらかを提示し，XがA話者とB話者のどちらに近いかを判定させた。自然音声では，“Happy” と“Normal” では正解率が約95%，“Angry” は正解率が約85%であり，他の感情に比べて話者性の差が小さいと考えられる．これに対して合成音声はどの感情においても70％程度となり，正解率は低下するものの話者性の識別はできていると考えられる。また，“Happy”は，話者性の識別率が高く，“Angry”は，話者によっては識別率の高い話者がいた。また，話者性の識別は声質の違いと感情の表出の違いとがあり，どちらが重要な要因であるかはさらなる実験が必要である。

researchmap
観光地の雰囲気可視化を可能とする簡易なアノテーションに基づく深層学習方式の研究

研究課題/領域番号：20K12079 2020年04月 - 2023年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

原直

　詳細を見る

担当区分：研究代表者

配分額：4290000円（直接経費：3300000円、間接経費：990000円）

課題1に関連して，これまでに収録を行っていたデータ約800個に対して，1名による詳細なアノテーション付与を行った．課題3で検討した項目に準じて付与を行った．アノテーションのための環境音聴取時には，ストリートビューの映像も同時に提示することで，音だけに依存しない場の印象や雰囲気をアノテーションすることとした．
課題2に関連して，課題1で得られたデータを利用し，単純なDNN方式による地域特性の分類を行った．分類器には，音源情報を入れることで，地域特性の推定精度が上がる．このとき，人手でつけた音源情報ではなく，音響信号と航空写真から推定した音源情報によっても，人手の情報と同程度の推定精度が得られることを示した．これにより，詳細アノテーションに比肩する情報を，簡易アノテーションに付加情報を与えることで得られる可能性が示唆された．さらに，Concept Driftに基づく適応方式の研究を進めた．
課題3に関連して，昨年度に引き続き，ISO12913のサウンドスケープとしての考え方に基づいた研究を進めた．地域特性を表現するアノテーションとして，8種類の評価軸を用いることとした．ただし，人手の評価によるばらつきも考慮し，8つの評価軸から，より簡潔に表現することができる2種の評価軸で表す方式を採用し，課題2における推定方式の検討を進めた．
課題2に挙げたConcept Driftの考え方を取り入れた研究として，国際会議1件，論文誌1件の発表をおこなった．また，各課題にて挙げた内容に基づき，国内会議2件の発表をおこなった．

researchmap
音響信号から学修者の活性度を測るPBL指導支援システムの開発

研究課題/領域番号：18K02862 2018年04月 - 2022年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

西村竜一, 原直

　詳細を見る

担当区分：研究分担者

配分額：4420000円（直接経費：3400000円、間接経費：1020000円）

本研究では、音情報処理の技術を応用し、大学等の高等教育機関で導入が進むPBLの指導者支援システムを開発する。
学修者の活性度抽出アルゴリズムの一部として、CNN Autoencoderによる音分類方式の検討を進めた。特に、収録環境の異なる2つのコーパスを用いた実験により、単に両者を混ぜたコーパスからモデル学習をするのではなく、Autoencoderによる特徴量抽出を介することで、より高い分類性能を持つモデルを学習できることを示した。画像と音声を含む会議データを収録し、その画像としての特徴と音声としての特徴を併用することで、会議参加者の発話意図の推定や参加姿勢の良し悪しを推定する検討を行った。
PBLのデータ取集と協調的アノテーションの実現の取り組みとして、グループワークに取り組む学生個々の参加情報記録システムを開発した。システムでは，指導者がタブレット端末に提示された学生の顔画像をタッチ操作することで、その学生のグループワークへの参加状況を記録することが可能である。本研究では、発言や相槌の回数、グループワークに対する貢献度を記録できるインタフェースを設計した。システムで提示する顔画像は、360度全方位の撮影が可能なビデオカメラで撮影したパノラマ画像から抽出する。実験では、協力者に依頼し、実際のグループワークを撮影した。また、データの利活用を円滑にするため、音声を匿名化する声質変換システムの開発を行った。提案システムは、(a) マイクロホンアレイを用いた対話音声の収録 (b) 各話者の音声に含まれる特徴量の抽出 (c) 深層学習による音声の声質変換を実現する。(c)では、ニューラルネットワークに基づいた敵対的生成ネットワークのアルゴリズムであるCycle-Consistent Adversarial Networksを用いた。

researchmap
ディープニューラルネットワークによる舌亜全摘出者の音韻明瞭性改善の研究

研究課題/領域番号：18K11376 2018年04月 - 2022年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

阿部匡伸, 原直, 皆木省吾

　詳細を見る

担当区分：研究分担者

配分額：4290000円（直接経費：3300000円、間接経費：990000円）

研究計画調書に記載した課題に関して，令和元年度（２０１９年度）に実施した内容は下記の通り．
（課題１）音韻明瞭度の改善「①-１調音結合の制約をDNNによりモデル化」については，両方向LSTMと前向きLSTMの性能を比較した結果，両方向は明瞭性よりは自然性，高品質化の効果が大きいことが明らかになった。「①-２唇情報表現の検討」については，音声のスペクトル情報と唇の画像情報の異なる特徴量を扱うことからDNNによる方式で検討を進めた。まず， Kinectにより取得した唇の輪郭とスペクトル情報を利用した結果，母音の明瞭性が向上することが明らかとなった。子音に比べて母音の継続時間長が長いためと考えられる。次に，DNNの特徴を利用して，音韻の情報を補助的に利用する方法を検討した。実験では，正解となる音韻情報を与えて改善の可能性を確認した結果，破裂音，摩擦音等の子音の明瞭性が向上することが明らかとなった。
（課題２）患者の発話負担軽減．「②-２疑似舌亜全摘出者音声データベースの構築」については，昨年度作成した下歯を覆うプレートを利用して，３名分の疑似舌亜全摘出者の音声と唇映像の同時収録データベースを構築した．
（課題３）リアルタイム動作．「③-２差分スペクトル利用による誤分析対処」については，WORLD方式によって分析し，３層のDNNによるスペクトル推定し，残差信号を利用した声質変換方式により，100ミリ秒の遅れてリアルタイム処理できることが明らかとなった。

researchmap
地域活性化政策立案のための音響信号による“賑い度”調査プラットフォームの研究開発

2015年07月 - 2018年03月

総務省戦略的情報通信研究開発推進事業 SCOPE（地域ICT振興型研究開発）

阿部匡伸, 原直

　詳細を見る

担当区分：研究分担者資金種別：競争的資金

researchmap
PBLの個人評価を目的とする活動音の可視化技術

研究課題/領域番号：15K01069 2015年04月 - 2018年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

西村竜一, 原直

　詳細を見る

担当区分：研究分担者

配分額：4680000円（直接経費：3600000円、間接経費：1080000円）

本研究では、PBL（Project-Based Learning; プロジェクト型学習）に参加する学修者の評価を支援する手法を音情報の可視化を通じて実現するための技術開発を行った。対話音声を用いたグループワークにおけるアクティビティの自動検出法を検討した。その結果を応用し、ウェアラブル音声収録端末を用いたグループワーク状況提示システムを試作した。加えて、深層学習型ニューラルネットワークに基づく音源情報可視化手法を検討した。

researchmap
ライフログに基づくプライバシーを考慮した高度な見守りシステムの研究

研究課題/領域番号：15K00128 2015年04月 - 2018年03月

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

阿部匡伸, 原直

　詳細を見る

担当区分：研究分担者

配分額：4420000円（直接経費：3400000円、間接経費：1020000円）

少子高齢化社会への移行に伴い見守りシステムの必要性が高まっている。本研究では、プライバシーを考慮できる見守りシステムを検討した。特徴は、①長期間に渡って蓄積したGPSデータからユーザの生活圏を自動推定し、②生活圏を量子化（GeoHex）表現することでプライバシ制御を可能とし、③見守る量子化レベルをユーザの行動に基づいて適応的に変更できる点にある。生活圏の推定アルゴリズムはF値0.85程度の性能を得た。また、見守る側と見守られる側での量子化レベルの好みの実験を行い、見守られる側ではユーザ依存性が大きいことを明らかにした。

researchmap
自動車運転状況の自動推定に基づく安全性に配慮した音声対話システムの研究

研究課題/領域番号：26730092 2014年04月 - 2017年03月

日本学術振興会科学研究費助成事業若手研究(B) 若手研究(B)

原直

　詳細を見る

担当区分：研究代表者

配分額：3640000円（直接経費：2800000円、間接経費：840000円）

以下を実施した．
（１）運転者の体や車両本体にとりつけたセンサから得られる生体信号や運転情報信号を用いて運転負荷の推定．スマートフォンで得られるセンサの利用を想定した運転負荷推定．（２）ユーザ負荷の観点で運転中の利用に適した対話戦略を評価．対話の主導権の方式と確認発話の方式を組み合わせた客観評価．（３）対話システムとして評価するための主観評価．特に，運転を模擬した動作と音声対話システムの利用という二重タスク課題における主観評価．（４）ユーザ負荷の推定結果を組み込める柔軟な対話戦略の選択方式を実装．グラフ探索に基づく対話戦略を導入．客観評価実験と主観評価実験による性能評価．

researchmap

▼全件表示

担当授業科目

プログラミング演習1 （2023年度）第１学期 - 水1～3
プログラミング演習2 （2023年度）第２学期 - 水1～3
プログラミング演習１（2023年度）第１学期 - 水1～3
プログラミング演習２（2023年度）第２学期 - 水1～3
ヘルスシステム統合科学アドバンストインターンシップ（2023年度）通年 - その他
ヘルスシステム統合科学専門英語（2023年度）後期 - その他
ヘルスシステム統合科学特別研究（2023年度）通年 - その他
ヘルスシステム統合科学特別研究（2023年度）通年 - その他
情報処理入門２(情報機器の操作を含む) （2023年度）第２学期 - 月1～2
情報処理入門２(情報機器の操作を含む) （2023年度）第２学期 - 木1～2
情報工学実験B (メディア処理) （2023年度）第３学期 - 火3～7,金3～7
情報工学実験Ｂ（メディア処理）（2023年度）第３学期 - 火3～7,金3～7
音声情報処理特論Ⅰ （2023年度）前期 - 月1～2
音声情報処理特論Ⅱ （2023年度）前期 - 木5～6
ディジタル信号処理（2022年度）第３学期 - 火1～2,木1～2
プログラミング演習1 （2022年度）第１学期 - 水1～3
プログラミング演習2 （2022年度）第２学期 - 水1～3
プログラミング演習１（2022年度）第１学期 - 水1～3
プログラミング演習２（2022年度）第２学期 - 水1～3
ヘルスシステム統合科学専門英語（2022年度）後期 - その他
ヘルスシステム統合科学特別研究（2022年度）通年 - その他
情報処理入門２(情報機器の操作を含む) （2022年度）第２学期 - 木1～2
情報処理入門２(情報機器の操作を含む) （2022年度）第２学期 - 月1～2
情報工学実験B (メディア処理) （2022年度）第３学期 - 火3～7,木3～7
音声情報処理特論Ⅰ （2022年度）前期 - 月1～2
音声情報処理特論Ⅱ （2022年度）前期 - 木5～6
ディジタル信号処理（2021年度）第４学期 - 月1,月2,木1,木2
プログラミング演習1 （2021年度）第１学期 - 水1,水2,水3
プログラミング演習2 （2021年度）第２学期 - 水1,水2,水3
ヘルスシステム統合科学専門英語（2021年度）後期 - その他
ヘルスシステム統合科学特別研究（2021年度）通年 - その他
情報処理入門２(情報機器の操作を含む) （2021年度）第２学期 - 月1～2
情報処理入門２(情報機器の操作を含む) （2021年度）第２学期 - 木1～2
情報工学実験B (メディア処理) （2021年度）第３学期 - 火3,火4,火5,火6,火7,木3,木4,木5,木6,木7
音声情報処理特論Ⅰ （2021年度）前期 - 木5～6
音声情報処理特論Ⅱ （2021年度）前期 - 木5～6
プログラミング演習（2020年度）１・２学期 - 水1,水2,水3
プログラミング演習1 （2020年度）第１学期 - 水1,水2,水3
プログラミング演習2 （2020年度）第２学期 - 水1,水2,水3
ヘルスシステム統合科学専門英語（2020年度）後期 - その他
ヘルスシステム統合科学特別研究（2020年度）通年 - その他
情報処理入門２(情報機器の操作を含む) （2020年度）第２学期 - 月1,月2
情報処理入門２(情報機器の操作を含む) （2020年度）第２学期 - 木1,木2
情報工学実験B (メディア処理) （2020年度）第３学期 - 火3,火4,火5,火6,木3,木4,木5,木6
情報工学実験第三（2020年度）第３学期 - 火3,火4,火5,火6
情報工学実験第四（2020年度）第３学期 - 木3,木4,木5,木6
音声情報処理特論Ⅰ （2020年度）前期 - 木5,木6

▼全件表示

学術貢献活動

日本音響学会第24回関西支部若手研究者交流研究発表会

役割：企画立案・運営等

日本音響学会関西支部（オンライン（Gather.Town）） 2021年12月4日

　詳細を見る

種別：学会・研究会等

日本音響学会関西支部では，若手研究者間での研究交流及び相互啓発を目的として，1998年より「若手研究者交流研究発表会」を開催しています。これまでに数多くの若手研究者の方々に参加・発表していただきました。本年度は，新型コロナウイルス感染症に対する各種イベントへの社会的要請等を鑑み，オンラインで開催します。研究者間の交流だけでなく産学の交流も深めるために，賛助会員の企業展示も開催する予定です。

researchmap