该接口可用于执行语音识别,包括实时语音识别和音频文件的识别,能适应多种使用场景的需求。
RecognitionTaskHint用于指定语音识别任务的类型提示:
'confirmation':适合诸如“yes”,“no”或“maybe”之类的指令。'dictation':类似键盘输入的语音听写。'search':识别搜索关键词。'unspecified':通用的语音识别。SpeechRecognitionResult表示语音识别的结果:
isFinal: 表示该转录结果是否完整且最终。text: 转录内容,为置信度最高的可展示文本。supportedLocales: 返回该语音识别器支持的语言区域列表,如 "en-US"、"fr-FR" 或 "zh-CN" 等。isRecognizing: 指示当前是否有识别请求在进行中。start(options: object): Promise<boolean>
从设备麦克风开始进行语音识别。
locale: 识别所用的语言区域字符串(可选)。partialResults: 是否返回中间结果(默认为 true)。addsPunctuation: 是否自动添加标点符号(默认为 false)。requestOnDeviceRecognition: 是否将音频数据留在本地进行识别(默认为 false)。taskHint: 指定识别任务类型('confirmation', 'dictation', 'search', 'unspecified')。useDefaultAudioSessionSettings: 是否使用默认的音频会话设置(默认为 true)。onResult: 用于处理识别结果的回调函数(参数类型为 SpeechRecognitionResult)。onSoundLevelChanged: 音量变化时触发的回调函数(可选)。recognizeFile(options: object): Promise<boolean>
对已录制的音频文件进行识别。
filePath: 音频文件的路径。locale: 识别所用的语言区域字符串(可选)。partialResults: 是否返回中间结果(默认为 false)。addsPunctuation: 是否自动添加标点符号(默认为 false)。requestOnDeviceRecognition: 是否将音频数据留在本地进行识别(默认为 false)。taskHint: 指定识别任务类型('confirmation', 'dictation', 'search', 'unspecified')。onResult: 用于处理识别结果的回调函数(参数类型为 SpeechRecognitionResult)。stop(): Promise<void>
停止当前正在进行的语音识别。
supportedLocales 来确定可用于识别的语言。.wav, .m4a)作为输入。