首页 > 其他分享> > 即构SDK新增焦点语音功能，可实现特定用户语音的聚焦

即构SDK新增焦点语音功能，可实现特定用户语音的聚焦

2021-01-27 18:29:55 作者：互联网

2021年，即构SDK每月迭代如期而至。今年，我们会着重介绍每月SDK的重要新增功能，让大家更清晰的了解到这些新功能的特性及应用场景。

重点新增功能

多人语音通话场景下的焦点语音功能

功能介绍

即构SDK1月新增焦点语音功能，适用于超多人语音通话场景，在多人同时说话的嘈杂环境下，依旧能聚焦特定用户的语音。支持开启多路混音模式，开发者通过设定拉流端在多路混音时要突出的目标流声音，实现特定用户语音的聚焦。

适用场景

随着疫情的反弹，全国各地中小学陆续叫停了线下教学活动，转而用空中课堂等线上的方式完成日常教学。因而，搭建一个尽可能还原现实课堂的线上教课空间，是实现高效教学的关键。

空中课堂一般为学校课程的线上化，不仅课堂人数规模大，还有像朗读、体育、音乐等此前未大规模线上化的课程，因此需要根据学科特色持续不断的优化空中课堂教学效果。以朗诵为例，既有单人朗读，也有学生齐声诵读的场景，在多人同时朗读时，老师需要分辨出不同学生的声音，进而提供针对性的指导。

即构“焦点语音”功能，让多个学生朗读时，也可实现聚焦特定学生声音。在热烈的课堂氛围中保证老师与学生以自然的方式进行互动，助力“空中课堂”实现高效的课堂教学监督，展现线上教学系统的优势。

功能优势

即构焦点语音功能，解决了空中课堂等线上教育场景下，教师同时监督多位学生朗读和学习状态的痛点。

从技术角度看，当一个线上教学课堂内有N个连麦通话的人，则课堂上每位成员的设备系统会输出 N-1 条音频流的数据。此时，降低设备性能开销和识别特定的说话人员，是首要考虑的技术难点。即构推出了多路混音模式，通过后台混音机制，降低用户拉取多路音频流带来的设备性能开销，同时提供突出音频流的列表，聚焦在特定的用户说话声音上，在喧闹的环境中仍支持清晰的语音通话。

其他新增功能

1.新增多种音效效果

SetVoicePreset 接口新增多种预设声音音效：清澈、高亢、嘹亮、饱满、假音、圆润、低沉、浑厚、女活力，增加实时语音趣味性。

SetReverbPreset 接口新增多种预设混响音效：嘻哈、飘渺、3D人声、留声机，可用于烘托房间氛围。

2.视频内部采集新增支持设置旋转角度

推流端启用视频内部采集旋转功能，可设置视频输出的画面方向。在教育场景中，可调整使用高拍仪设备的拍摄角度，达到教师端与学生端画面视角观看一致的体验。

新增接口 SetCaptureFrameRotation，设置逆时针旋转 0°（默认值）、90°、180°、270°，支持在推流过程中使用。

3.新增本端设备摄像头状态回调（Windows）

新增摄像头状态回调功能，当本端设备的摄像头发生改变时，可获取相关的状态变化事件，可用于判断摄像头设备是否正常工作。

4.拉流质量回调新增音频和视频卡顿统计指标

新增多个拉流质量回调指标：音频和视频卡顿累计次数、音频和视频卡顿累计时长、音频和视频解码累计时长。方便开发者了解拉流端在 RTC 通话场景中音频和视频的质量，通过数据洞悉业务表现。

此外，还新增了流控触发模式、摄像头权限状态查询、设置系统声卡采集音量、设置拉流缓存区间值等多项功能，实现更优质的音视频体验。完整的SDK迭代内容，欢迎进入“ZEGO-开发者中心”查看。

标签：功能,场景,音频,新增,语音,即构,SDK
来源： https://blog.csdn.net/zego_0616/article/details/113261200