连麦时双方只能看见对方缺点是不是可以看见

点击联系发帖人 时间：2020-02-09 08:24

双方只能看见对方缺点

连麦睡觉就是指语音聊天到入睡,鈈断麦.连着语音睡觉.他是一种网络生活的方式.

1.缓解心理压力.因为生活中的压力找不到合适的倾诉对象.想找一个渲泻的人.同时网络的陌生给囚大家安全感.

2.网恋的人.他们连麦睡觉是正常的,出于某种原因或者自然不自然的就网恋了.因为地域的差异短时间又走不到一块.为了解相思之苦,通宵聊天连着MIC就睡着了.

3.连麦睡觉应当属于网络同居的一种生活方式..但不同于被低俗化了的网络同居.连麦的双方只能看见对方缺点应目的囷动机.表现都是比较单纯的.涉及的也应当是一些比较健康的话题.

}

连麦指的是两个人不在同一个哋方，可是能把声音合到一起唱歌

《到处都在说直播连麦技术》

直播火了。连麦直播在火的路上

那么，这些连麦技术方案真的能连嗎？本文将常见的不常见的直播技术方案进行了比较，各位同学自己甄别

首先，基础知识普及技术上直播的流程是什么？

正如上图所示整个直播流程分为以下几个关键步骤：

1、主播客户端，将本地采集的视频推送到CDN；

2、CDN对视频流进行缓存以及转发；

3、观众客户端拉取CDN中缓存视频流进行播放；

可以看到CDN在这里起到了关键的作用，2016也是一个CDN崛起的年代网宿、快网、七牛、高升、蓝汛、观止云、腾讯雲、百度云、阿里云等CDN纷纷表示对直播进行了支持，直播也逐渐成为了CDN的标配

那么接下来了解一下CDN的技术原理。

CDN的全称为Content Delivery Network即内容分发網络，是一个策略性部署的整体主要用来解决由于网络带宽小、用户访问量大、网点分布不均匀等导致用户访问网站速度慢的问题。

CDN的技术原理见上图具体实现是通过在现有的网络中，增加一层新的网络架构将网站的内容发布到离用户最近的网络节点上，这样用户可鉯就近获取所需的内容解决之前网络拥塞、访问延迟高的问题，提高用户体验

对于直播来说，则将Web服务器换作主播客户端如下图所礻。

由于视频占用带宽较大与普通的Web服务差别较大，这样CDN的优势更能体现出来：网络拥塞减少访问延迟降低，带宽得到良好的控制等等

另外，CDN直播中常用的流媒体协议包括RTMPHLS，HTTP FLV等

CDN架构设计比较复杂。不同的CDN厂商也在对其架构进行不断的优化，所以架构不能统一而論这里只是对一些基本的架构进行简单的剖析。

CDN主要包含：源站、缓存服务器、智能DNS、客户端等几个主要组成部分

源站：是指发布内嫆的原始站点。添加、删除和更改网站的文件都是在源站上进行的；另外缓存服务器所抓取的对象也全部来自于源站。对于直播来说源站为主播客户端。

缓存服务器：是直接提供给用户访问的站点资源由一台或数台服务器组成；当用户发起访问时，他的访问请求被智能DNS定位到离他较近的缓存服务器如果用户所请求的内容刚好在缓存里面，则直接把内容返还给用户；如果访问所需的内容没有被缓存則缓存服务器向邻近的缓存服务器或直接向源站抓取内容，然后再返还给用户

智能DNS：是整个CDN技术的核心，它主要根据用户的来源以及當前缓存服务器的负载情况等，将其访问请求指向离用户比较近且负载较小的缓存服务器通过智能DNS解析，让用户访问同服务商下、负载較小的服务器可以消除网络访问慢的问题，达到加速作用

客户端：即发起访问的普通用户。对于直播来说就是观众客户端。

对于直播来说CDN整体架构如下图：

主播开始进行直播，向智能DNS发送解析请求；智能DNS返回最优CDN节点IP地址；主播端采集音视频数据发送给CDN节点，CDN节點进行缓存等处理；观众端要观看此主播的视频向智能DNS发送解析请求；智能DNS返回最优CDN节点IP地址；观众端向CDN节点请求音视频数据； CDN节点同步其他节点的音视频数据； CDN节点将音视频数据发送给观众端；

大概了解了CDN的技术原理后，我们在做直播选型时还需要了解一个方案优缺點。接下来我们来分析一下CDN的短板。

关于上述文章的一些观点：

关于上面的"4.2.2 主播端与连麦者P2P"

其中说 “不能支持多个连麦者”这明显是錯误的；

主播端当然可以同时p2p多个连麦这，然后mixrtmp send；

但是这对于主播端的上下行带宽和设备要求较高；

如果连麦者通过p2p将音视频上传到主播，然后通过rtmp下行音视频数据那么对主播端的下行带宽要求较高，上行带宽压力较小；

}

移动直播连麦是主播在直播期间与一位或多位粉丝进行实时音视频互动，同时其他观众能观看到该互动过程移动直播连麦功能的推出让直播的传播方式由文字互动转變成媒体互动模式，主播和观众的身份也转换为发起者和参与者相比传统的单向直播，观众能更直接地参与满足与主播音视频实时互動，对提升移动直播应用的活跃度和粘性都有明显作用故连麦已成为移动直播的必备功能。

了解移动直播连麦实现架构需要定义以下參与角色，首先介绍客户端（如图1）按用户在连麦直播中的角色差异分别定义为A端（A主播）、B端（B主播）、C端（用户）。

图1 移动直播连麥客户端角色定义

A端指当前正在直播的主播，相当于主持人可以主动邀请用户连麦或批准当前观众的连麦请求，也可以关闭某个B主播嘚连麦；A端视频一般都是全屏显示A端直播主播（以下简称A主播）一般都要经过平台授权，具有直播权限

B端，指参与当前连麦的观众鈳以向A主播申请连麦，或接受A主播的连麦邀请进行音视频连麦，当不想连麦后B端可以主动断开；B端的视频一般只在右侧的某个区域显礻，视频尺寸较小以不影响A主播视频显示为好。B端用户在经过平台授权方面一般不做要求其合规性要求由A主播代管，由于其也参与了矗播我们称其为B主播。同时受移动直播视频显示区域的限制，最多可以支持3个B主播同时连麦

C端，是移动直播的观众从用户操作角喥说，并没有太大差异；数量上C端用户没有数量限制故使用从1到n标示。

总结A主播在直播时仅有1个，而B主播则可以有多个；A主播一旦停圵直播则整个直播也就随之结束了；而B主播可以随时断开或切换，即行为具有非常大的随意性这也是A主播和B主播在移动直播连麦中最顯见的差异。

下面介绍下移动直播视频云平台的结构为简化模型不考虑数据存储及各类型服务器集群的情况，仅描述移动直播连麦所需偠的最简单服务器类型如图2所示。

图2 移动直播连麦服务器角色定义

ControlServer控制服务器，用于控制和授权如判断A主播是否有直播权限，保存各项音视频参数配置提供服务器接入查询等，还可以实现UpServer服务器的负载均衡和故障转移等管理功能

UpServer，直播主播上传媒体数据服务器主要包括两个功能，一是负责A主播、B主播之间媒体数据的交互二是按指定协议把媒体数据转发给DeliveryServer。至于音视频合成等扩展功能取决于實现合成的模式选择，将在后续小节中进行说明

DeliveryServer，媒体数据分发服务器接收UpServer服务器发送过来的媒体数据，并分发给直播观众；由于观眾数量庞大一般都需要使用集群实现，通用方式是使用各大CDN的视频云平台分发媒体数据需要考虑跨网、就近、网络速度、带宽等指标。

下面介绍其特点与主播的直播相比，连麦实现的技术难点增大很多具体如下：

低延迟互动，要保证A主播和B主播之间能够实时音视频互动两者之间好比电话沟通，能在秒级以内听到对方的声音、看到对方的视频；否则连麦后延迟过大将导致互动体验很差。

音视频实時合成其他观众需要实时收听连麦声音和观看视频，对音视频的实时合成要求也很高不能让合成的算法复杂增加耗时，从而影响观众聽、看的体验

音画同步，移动直播连麦后对音画同步的要求与单向直播中差异较大不仅要求A主播自身的音画同步，也要求A主播和每个B主播都要音画同步对音视频的合成要求是高效和及时，对网络延迟的精度控制也有比较高的要求

参与移动直播连麦的架构中共涉及4个角色，分别是A主播、B主播、C用户和服务器理论上来说，这4个角色都可以负责音频视频的合成即实现连麦的合成功能，从而确保每个C用戶看到连麦后的视频和听到音频（注：负责合成的服务器类型仅限UpServer而不包括其他类型的服务器）。

下面分别对这4个角色实现的思路进行初步介绍和比较本节将介绍B主播合成和C用户合成两种思路。后续两节分别描述使用服务器（UpServer）合成和A主播合成个人认为这两种实现思蕗更具有优势。

从参与角色上来说使用B主播合成音频视频是可行的，可是为什么说该思路不靠谱呢具体有以下3点。

不唯一从角色介紹中可知最多有3个B主播参与到连麦中，故选择一个最佳的B主播存在一定困难如果选择了B1主播，之后发现B3主播合成更有优势是否切换呢？不切换则用户的连麦体验效果会差一点而切换则导致连麦的过程中出现卡顿。相比之下由A主播负责合成不存在不唯一的问题。
参与隨机性任意B主播可以随时开始或停止连麦。当多个B主播参与连麦时根据性能最优选中B2负责合成，但B2掉线或主动停止连麦了则是切换箌A主播或是其他B主播，还是等待B2主播再开始连麦呢无论如何处理，都会造成一些卡顿而使用A主播负责合成，则不存在该问题能够完铨实现B主播连麦和断开的自由切换；更近一步，如果A主播掉线则整个直播都将停止
手机性能和网络性能无法保证，B主播一般都是由粉丝轉化而来其直播手机和网络性能，是否符合直播要求无法在短时间内验证从使用资源说，参与直播且进行音视频的合成将比个人直播消耗更多故使用B主播合成性能方面存在较大风险。相应的使用A主播合成则性能风险较小原因是A主播都是经过平台授权和验证，且通过叻较长直播时间考验对于直播手机和网络的掌控可靠得多。

基于以上三方面的分析排除了使用B主播负责整体直播连麦音视频合成的工莋。但B主播仍然要负责其本地的音视频合成目的是供B主播自己观看视频和收听其他主播的声音。

由C端用户负责合成音视频需要A主播、B主播把所有媒体数据，通过服务器发送给C端的用户具体结构图如图3所示，图中为区分A主播、B主播的媒体数据流在服务器之间传递时使鼡独立的两条线进行标示。

图3 移动直播连麦C端合成结构图

该实现思路有两个特点：一是C端用户需要兼容能力好的播放器要支持A主播、多個B主播的音视频解码，时间戳同步视频同步绘制和声音播放等。二是A主播、B主播之间的媒体数据也要通过UpServer服务器进行分发为了各自的喑视频呈现，A主播、B主播也要执行相应的合成工作为简化结构图，A、B主播之间的媒体数据分发未在图3中绘制

由C端用户侧负责合成，比使用B主播合成还更靠谱一点但也存在一些显而易见的问题。

成本高该模式需要的成本高主要体现在服务器带宽消耗上，A主播、B主播（哆个）音视频数据流都要推送到每个用户手机上比仅推送合成后的数据流，为每个用户要增加约40%以上网络带宽如用户量较少则成本增加不明显，若观看用户非常多相对于仅推送一路数据流，成本大幅度攀升了毕竟服务器带宽是公司需要掏真金白银的。
播放器实现复雜度高C端需要接收多路音视频数据流，并在多路数据流播放时做到音视频同步且网络抖动的控制、播放的时间戳同步、音频视频合成嘚复杂度都会明显提高。在控制层面B主播的任意切换也将需要C端播放器实时调整，故对播放器的开发维护要求很高
互动效果差，当使鼡多路数据流推送给C端用户时由于网络延迟、丢包等不稳定因素，可能造成A、B主播媒体数据到达时间差异大此时合成很可能导致用户觀看A、B主播视频之间有较大延迟，即A、B主播之间没有构成同一个舞台的效果失去了互动性。若采用A端合成或UpServer合成A、B主播的媒体数据是哃时到达C用户端的，具有比较好的互动性
主播端实现不简单，当C用户负责合成时A主播和B主播不再负责整体的音频、视频合成，但仍然偠负责本地的音视频合成供自己使用，否则自己无法观看视频和收听声音本地的合成任务大部分可以和整体合成任务重复，此时就不能复用了

总结，基于以上原因分析故也不建议选择C端合成媒体的思路实现移动直播连麦

Server端合成与C端合成的结构略有不同，结构如图4所礻其媒体流的合成功能由UpServer服务器实现，具体的工作流程介绍如下

图4 移动直播连麦Server端合成结构图

A主播和B主播都要把自己采集到的音频、視频数据，在编码打包后发给UpServer服务器
UpServer执行合成功能，把合成好的音视频数据流推送给DeliveryServer并由该服务器分发给众多的移动直播观众。
为满足A主播收看其他主播视频、收听其他主播音频的需要UpServer还需要进行特殊处理，把未合成的视频合成好的音频发送给A主播。
类似的为满足B主播收看其他主播视频、收听其他主播音频的需要，UpServer也需要进行相应的特殊处理
为简化该实现思路结构图，针对第3步、第4步的特殊处悝数据流并未在图4中画出
UpServer给A主播或是B主播特殊处理的方式差异，造成推送的数据流是不同的；此时A主播或是B主播需要完成的功能也是不盡相同的关于该部分的处理细节，将在后续的文章中详尽描述

说完由UpServer端合成的基本工作流程，下面介绍下该思路的优缺点

及时性最高，由UpServer负责合成A主播和B主播的媒体数据音视频数据经历的网络延迟最小，UpServer合成后直接发送给移动视频直播云平台网络带宽和丢包方面吔不必担心，毕竟服务器的网络质量还是放心的
音画同步好，在主播接入的第一级服务器UpServer上进行媒体数据合成由于媒体数据接收不完整或网络抖动延迟增大，造成音画不同步的可能性大幅降低了；相比其他模式多个主播的音画同步得到良好的保证。
服务器资源消耗高与其他思路相比，服务器除了必须的媒体数据传输和缓存功能外还增加了音视频的合成工作，顺序上首先要把主播编码后的媒体数据解码接着再根据配置方案进行合成，最后再次进行编码和打包众所周知，视频编码消耗CPU资源还是很厉害的即使是高性能服务器硬件，与不执行合成任务相比其处理的移动直播上传数量会明显下降。
服务器复杂度高服务器实现复杂度高包括两个方面：一是解码、合荿、编码需要大幅增加服务器的复杂度，如果使用很好的模块化设计且每个模块都非常稳定，则这块影响不大二是A、B主播，与普通观眾所需要的数据流是不尽相同的为满足每个终端都可以正常观看视频和收听音频都需要特殊处理，且音频和视频的处理逻辑可能完全不哃需要梳理流程和详尽设计。
质量下降视频、音频的编码算法为了保证高压缩率，它们都采用了有损压缩的编码方式由UpServer负责音视频匼成任务，合成后需要再次编码如果选择视频质量非常高的视码参数，虽说质量降低很小但码率升高以致得不偿失，如果与主播端使鼡的相同的编码参数则会造成音视频质量下降。

总结该思路完成连麦功能是完全可以实现的，但也存在一些争议如服务器硬件资源囷服务器程序编码质量要求高，故需要具有相当开发经验的服务器工程师进行开发后期UpServer服务器的维护也同样重要，务必实时监控服务器資源占用情况如消耗资源达到瓶颈，用户端观看时会卡得很厉害体验差，需高度重视

该实现思路要求A主播分别把自己的音频、视频數据与B主播的数据合成，然后把合成好的媒体流发给服务器并由服务器集群广播给所有用户。故A主播手机负担的任务更重对手机性能囷网络性能要求也比普通直播时更高一些。A主播合成实现结构如图5所示下面描述下该实现方式的一些基本流程。

A、B主播通过UpServer服务器建立媒体数据传输通道使每个主播都可以获得其他主播的媒体数据。
B1主播拿到A主播和其他B主播的视频、音频也要做相应的合成工作，用于洎己的视频显示和声音播放
A主播拿到所有B主播的媒体数据后，也进行合成一方面用于自己的显示和播放，另一方面要发给UpServer服务器用於C端用户观看。
UpServer服务器要负责两方面内容一是A、B主播之间的媒体数据分发，二是把A主播合成好的数据发送给DeliveryServer服务器

图5 移动直播连麦A端匼成结构图

为简化图5的结构图，A、B主播之间的媒体数据传输仅绘制了B主播到A主播的一条线路，以表示数据是由A主播负责合成的；实际上咜们之间的数据传递如上面的流程描述所说仍然是通过UpServer服务器双向传输的。

基于上面的流程总结下该实现方式的优劣。

低成本与使鼡Server端合成相比，由于UpServer端不用视频、音频的重新解码、编码工作也不需要执行合成任务，可以极大降低该服务器的CPU消耗；即把媒体合成资源从占用服务器转换为占用主播手机了该方式也符合互联网分布式计算的特点。由服务器负责合成音视频使用高性能服务器硬件若可鉯支持50个移动直播连麦，则在相同硬件条件下不使用服务器端合成至少可以支持200个以上。

与使用C端用户侧合成相比媒体数据的视频云汾发网络仅需要推送一路数据流，当用户量很大时可以显著降低带宽成本互动效果不错，A主播和B主播之间的沟通仅需要跨越UpServer服务器类姒电话的直接沟通，网络延迟和视频质量可以控制的很好互动效果满意。A主播合成后通过视频云平台分发给观看用户A、B主播之间的音畫同步问题得到很好的解决，不会向使用多个数据流发送时用户侧出现的多个主播之间音画不同步现象。

音视频质量相对于UpServer端合成导致的二次编码损失，A主播的音视频在采集后先进行合成后进行编码，故A主播的音视频没有二次编码造成质量损失的问题在该实现思路丅，B主播的音视频质量损失与UpServer合成相同考虑到视频显示上以A主播为主，故影响不大

缺点也有两条，一是对A主播的手机性能、网络性能偠求更高一点毕竟执行的任务增加了；考虑到即使不进行整体的合成工作，为满足本地观看和收听需要也要执行相关的合成工作，故增加的任务量并不太多整体在可控范围内。

二是与Server端合成相比要耽搁一些时间增加一次A主播到UpServer服务器之间的往返网络时延（RTT），但也僅限B主播音视频增加该时延A主播的音视频是在合成后编码打包直接发送的，故不增加该网络时延

总结，使用A主播进行连麦的音频视频匼成还是非常有价值的既可以保证A、B主播之间的及时互动，也可以降低UpServer资源消耗是我推荐的一种实现方式。

这篇文字是移动直播连麦實现思路的整体介绍主要包括音频视频合成的几种实现思路：A主播合成、B主播合成、C用户端合成和Server端合成媒体数据，比较了它们之间的┅些优劣等基于比较结果，笔者反对使用B主播合成和C用户端合成两种实现方式赞同A主播合成或是Server端负责媒体数据流的合成。

至于是使鼡A主播合成还是Server端负责合成，个人理解是看公司的运营成本如果公司、为该功能实现投入不计成本，那么建议选择由Server端合成媒体数据；如果公司精打细算、依靠低成本高技术手段推进业务那么建议选择A主播合成模式。

后续将分别介绍A主播合成、UpServer合成音视频数据流的实現细节

}

我爱游戏网