關于VR直播解決方案的實踐與探討
本文針對VR視頻直播新技術,提出了解決方案,將采集、處理、分發(fā)、播放等集成一體的解決方案。
一、引言
目前,虛擬現實技術VR和VR直播這兩塊發(fā)展火爆,特別是VR直播成為2017年VR行業(yè)的熱點。VR技術催生了全新的用戶體驗與商業(yè)模式。移動直播的強“自媒體”屬性,與VR全景技術帶來的真實臨場感,使得移動VR直播在體驗上遠遠超過任何一種直播模式。移動VR直播將顛覆互聯網社交模式,無論是草根網紅的個人秀場,還是大牌明星的實景互動,都不可避免成為新互聯網時代的巨型流量入口。
二、解決方案
直播被定義為視頻行業(yè)從單向傳輸到實時互動的一場革命,在1.0時代,PC/平板、手機是重要的載體,用戶參與互動方式主要通過禮物、打字獲得短暫的和主播互動的機會,臨場感的缺乏和交互方式的單一是其最大的不足。而VR直播所帶來的沉浸式的體驗直接把直播從1.0時代推向了2.0時代。
一個完整的VR直播解決方案一般需要采集端設備、視頻編輯、推送高水平、直播管理后臺、網絡分發(fā)以及播放端多個環(huán)節(jié),這些環(huán)節(jié)環(huán)環(huán)相扣,我們基于云端資源和現有的設備資源,探索了采集、處理與分發(fā)三大架構,從采集端,到云端和用戶端的業(yè)務流程,實踐了VR直播一整套的解決方案。
(一)VR采集端
采集主要包括視頻拍攝,數據采集與輸出
采集設備一般分為電影級和廣播級。信號源可以是多種,VR直播一般由4-16個攝像信號構成,全方位360全景信號。采用高清信號輸出,構建成4k信號。虛擬的信號設備可以使用HDMI、SDI、AV、VGA、File、IP流等信號。
1.電影級采集設備
電影級采集設備目前主要有HeadcaseVR、HypeVR、NextVR、J2VR等。
HeadcaseVR:2016年正式亮相了全新移動VR拍攝方案的HeadcaseVR團隊。采用2/3英寸的CCD傳感器,單分辨率1920×1080。60FPS的幀率表現。其中J2V是中國的團隊,是國內最早進入全景視覺領域發(fā)展的創(chuàng)新型公司。J2VR也是經過幾代更新的電影及VR解決方案。采用4臺RedDragon分別對四個方向進行拍攝采集。最終達到24K錄制100FPS的標準。
2.廣播級采集設備
XONE一體化全景攝像機:支持機內實時拼接,支持雙組360度全景視頻同步拍攝,采用SONY 1/1.8英寸CMOS,全景錄制6K/全景直播4K。支持通過RTMP協(xié)議進行串流推送、支持支持通過PC客戶端或APP客戶端進行預覽、編碼支持H264/.H265 HEVC高壓縮比編碼、幀率:1-30fps。
3.民用級
國內民用級的全景攝像機較多,例暴風魔眼、Insta 360、Theta、Wipet、360fly等,在拼接畸變、流暢性、色彩還原、矯正等多個方面不會很成熟,適合自拍旅游等場景使用。
4.核心算法
VR直播采集設備完成的不止是采集內容這一步。設備里面一般會配套搭載的軟件和算法才是核心技術。在VR直播中,所有的拼接都是直接即刻完成的,例如縫合、映射、美顏、編碼、特效)白平衡,曝光等)。即將多鏡頭拍攝的畫面進行亮度色彩調整、對齊、畸變矯正、投影到球面等一系列處理后,基于圖像特征control points控制點,合成為一幅完整畫面的過程。
核心圖像處理算法,直接影響系統(tǒng)資源占有率,直接影響碼流、帶寬和存儲。核心算法的好壞直接影像圖像邊緣彎曲的矯正,場景的分割,虛擬PTZ、轉動、放大,這些都是由核心算法帶動的。
現在業(yè)內的產品,針對圖像矯正,有兩種處理方式,一種是前端攝像機內置軟件處理,另外一種是后端軟件處理,其都是對圖像邊緣像素和水平展開進行矯正,圖像矯正的關鍵在于圖像邊緣像素的還原完整度如何。前種方法節(jié)省了后端和網絡資源,避免了帶寬和存儲的壓力,即在前端就完成了對圖像進行矯正處理壓縮,最終將一個水平展開的圖像傳輸到后端平臺,使用者可根據需求選擇全景畫面或四畫面顯示,圖像很具實時性。而后一種將圖像矯正做到后端電腦上,其優(yōu)勢是借助電腦硬件快速的處理能力和軟件的完備性,其能很完美地實現全景圖像展開和四畫面顯示,從處理能力來說無疑后端機更具突出表現,效果或更要好一些,但也缺實時性。
圖像校正算法被嵌入到攝像機內是當前技術市場的主流,其更符合用戶即插即用的使用習慣,借助PC機的產品功能雖會很完美但未必會被用戶接受。
(二)VR云端處理
VR云端處理包括視頻數據處理、實時同步、視頻編輯、合成、數據推送、云存儲與云端轉碼等,我們利用了現有的推流設備、利用了阿里視頻云資源實現了上述功能。
1.推流
從VR采集的視頻流,我們使用了NSCaster推送至云端服務器,NSCaster整機采用便攜化設計,設備高度集成化,內置主機、17.3寸全高清顯示屏、PC鍵盤、鼠標觸摸板、導播操作鍵盤、攝像機云臺操作桿、視頻輸入輸出接口封裝、專業(yè)音頻輸入輸出、調音臺、藍牙無線通話、TALLY輸出、熱插拔數據硬盤、DVD刻錄機等。支持總共12路輸入,其中四路SDI/HD-SDI/3G-SDI攝像機輸入、一路全接口(SDI/HDMI/DVI/VGA/分量)輸入,一路網絡輸入、兩路DDR(視頻素材)輸入、四路虛擬場景輸入。
網絡輸入可用于通過網絡接入電腦桌面、Android設備、iOS設備;也可以接入網絡流信號,支持RTMP/ RTSP/MMS/VJVGA/VJTeacher/HTTP TS/UDP TS協(xié)議,支持IP攝像機輸入;也可以用于遠程訪談連線。
兩路DDR,用于播放本地視音頻和圖片素材,支持絕大部分常用視音頻和圖片文件;支持單文件播放和列表播放,支持循環(huán)播放;支持播放進度調整,支持播放倍率調整,支持播放時間倒數;支持與切換配合自動播放。支持MMS推流/拉流、FLASH/RTMP推流、UDP TS單播/組播網絡直播。
2.視頻云處理平臺比較
具備快速部署視頻服務、順暢運營、集成方便、開發(fā)快速上線,并且運維簡單等產品特性,重點對國內主要的四家視頻云服務商進行了比較和分析)詳見表2-1)。
表2-1 關于視頻云平臺整體比較
項目 | 騰訊云視頻 | 網易視頻云 | 七牛直播云 | 金山視頻云 |
服務 | 直播、點播、互動直播 | 直播、點播、互動直播 | 直播 | 直播、點播 |
推流sdk | Android、iOS及OBS(第三方) | Window、Web、Android、iOS及OBS(第三) | Android、iOS及OBS(第三方) | Android、iOS及OBS(第三方) |
播放器sdk | iOS、Android, Web | Window、iOS、Android、Web | iOS、Android、 H5、PC | iOS、Android、H5、PC |
轉碼 | 10,000+分布式轉碼集群,2000并發(fā)轉發(fā) | 10,000+分布式轉碼集群 | 無點播產品形態(tài) | 分布式轉碼,采用軟硬件混合轉碼技術,支持H264,H265編碼 |
CDN | 全球400+ | 全球500+ | 全球300+ | 進千個節(jié)點 |
直播錄制 | 支持 | 支持 | 支持 | 不詳 |
安全 | 防盜鏈、黑白名單 | 防盜鏈、回源鑒權 | 防盜鏈、播放地址加密、黑白名單 | DRM、防盜鏈 |
美顏 | 美顏+美白 | 濾鏡+美顏 | 美顏 | 不詳 |
鑒黃 | 內測 | 支持 | 支持 | 未知 |
并發(fā)量 | 千萬級 | 千萬級 | 百萬級 | 千萬級 |
騰訊云視頻互動直播方案比較成熟,與騰訊云通信(IM)結合緊密,業(yè)務集成度較高,目前臺內新麥是很好的案例。七牛直播云沿襲七牛云的精品路線,側重于直播,開放云端 API 實現透明播控管理,CDN節(jié)點相對要少一些。金山視頻云提供了點播數據挖掘、H.265編碼其特色(當然H.265需要視頻源高清而且終端性能強勁才有明顯效果),客戶端SDK集中在移動端,直播還支持OTT播放盒、超級電視等多屏播放,在VR直播方面已經在GITHUB開放了部分SDK。網易視頻云功能相對完善,同時支持實時互動直播,而且具有各種場景的完整解決方案,擁有千萬級并發(fā)量,SDK也非常全面。接入方便,新手也只需一天就可以為APP接入音視頻功能。
(1)穩(wěn)定性比較
近期云計算的宕機現象再次發(fā)生,云服務的穩(wěn)定性變成了影響用戶抉擇的重要因素之一。當然,對于視頻云服務來說,穩(wěn)定性不止于數據中心層,更需要考慮視頻流鏈路的穩(wěn)定,包括對弱網環(huán)境的處理,對卡頓、延遲現象有極地的容忍度。
表2-2 關于視頻云平臺穩(wěn)定性比較
騰訊云視頻 | 網易視頻云 | 七牛直播云 | 金山視頻云 | |
機房 | 自建機房 異地多機房 多機房架構設計 | 自建機房 異地多機房 多機房架構設計 | 托管云機房 | 有自建機房 |
傳輸 | 傳輸加密 存儲加密 | 傳輸加密 存儲加密 | 傳輸加密 存儲加密 | 傳輸加密 存儲未知 |
Qos | 未提及 | 有 | 無 | 無 |
從一定程度上說,自建機房意味著具備專業(yè)的運維團隊、更強的突發(fā)事件應對能力、更高效的突發(fā)事件響應速度,而這些因素恰恰是提供穩(wěn)定服務的關鍵。此外,傳輸機制保證了數據的安全性,網絡QoS策略則能夠保障復雜網絡下的流暢直播體驗。而服務模式決定了是否能夠快速響應客戶的技術、服務訴求。
(2)技術服務
企業(yè)級云服務和消費級產品最大的不同,就是對技術服務的需求更甚于對資費的敏感,剛剛發(fā)展起來的云服務尤其如此。對于視頻云服務,因為復雜的場景、冗長的鏈路背后是復雜的技術,而視頻服務商還需要快速為自己的用戶解決問題,讓這些最終用戶滿意,所以技術支持必不可少。
表2-3 關于視頻云平臺技術服務比較
騰訊云視頻 | 網易視頻云 | 七牛直播云 | 金山視頻云 | |
開發(fā)文檔/ 技術課程 | 簡單的開發(fā)文檔 | 詳細完整的開發(fā)文檔 | 詳細完整的開發(fā)文檔 | 官網產品文檔和API文檔均尚未找到視頻云資料 |
技術支持 | 7x24小時服務、QQ大群討論、1V1大客戶服務 | 7x24小時服務、 1V1專家支持 | 1對1 QQ群支持 | 不詳、官網沒提到 |
故障承諾 | 100倍故障賠償、5天無理由退款 | 100倍故障賠償 | 100倍故障賠償 | 不詳、官網沒提到 |
3.金山云的優(yōu)勢
云平臺VR具體技術參數與一般的視頻并無區(qū)別,比較大的亮點,就是各家H.265的技術。例如金山公司的H.265生態(tài)鏈打通后,H.265和VR結合具備了畫質和帶寬的優(yōu)勢。
限制VR直播的問題在于碼流。因為VR視頻內容在映射后,肉眼可視的分辨率會下降很多。所以對原始視頻的畫質要求就比較高,一般都要求在4K或者8K,4K分辨率下,碼流接近20M。如果H.265能夠在采集端得到大范圍的推廣,可以大幅降低此處的帶寬壓力。華為公司擁有最多的核心專利,是標準的主導者,但是H.265受限于專利費,目前看來大幅應用于采集端還有很長的路要走。
具體優(yōu)勢體現在上行碼率自適應,窄帶高清轉碼,截圖,錄制,時移等功能和服務;具備較低帶寬直播時延,能保證直播的實時交互;千萬級直播并發(fā)能力,可動態(tài)擴展的直播技術架構。提供URL加密,視頻加密、防盜鏈多種安全防護,減少盜播,錄播風險。
(三)用戶端開發(fā)
用戶端主要包括全平臺播放器部署、同時支持PC、手機、VR頭顯方式呈現。
全平臺播放器部署采用了KSYMediaPlayer SDK的SDK包進行開發(fā),重點實踐了APP端的體驗。KSYMediaPlayer SDK是金山云播放內核官方推出的iOS和Android平臺上使用的軟件開發(fā)工具包(SDK),為iOS和Android開發(fā)者提供簡單、快捷的接口,幫助開發(fā)者實現iOS和Android平臺上的多媒體播放應用。
1.KSYMediaPlayer SDK的快速集成
金山云播放內核涵蓋Android、iOS、Flash和瀏覽器插件四個平臺,基于FFmpeg自主研發(fā)音視頻媒體播放內核,作為一款全平臺兼容的軟件播放方案,金山云播放內核提供了跨終端平臺的播放器SDK,以及開放的音視頻播放、控制接口和完整的開源調用示例,不僅極大降低開發(fā)門檻,同時支持客戶快速在多個平臺發(fā)布產品。
(1)KSYMediaPlayer SDK 功能
與系統(tǒng)播放器MPMoviePlayerController接口一致,可以無縫快速切換至KSYMediaPlayer;
本地全媒體格式支持, 并對主流的媒體格式(mp4, avi, wmv, flv, mkv, mov, rmvb 等 )進行優(yōu)化;
支持廣泛的流式視頻格式, HLS, RTMP, HTTP Rseudo-Streaming 等;
低延時直播體驗,配合金山云推流sdk,可以達到全程直播穩(wěn)定的4秒內延時;
實現快速滿屏播放,為用戶帶來更快捷優(yōu)質的播放體驗;
支持畫面旋轉,音量調節(jié)等各種功能;
版本適配支持iOS 7.0以上版本;
業(yè)內一流的H.265解碼;
2M大小的超輕量級直播sdk;
支持bitcode
提供了支持直播和點播兩個靜態(tài)庫,相比直播,點播支持了更豐富的封裝格式和音視頻編解碼格式,二者支持的具體功能如下:
表3-1 點播和直播支持協(xié)議
直播 | 點播 | |
流協(xié)議 | HLS, RTMP, HTTP, FILE | HLS, RTMP, HTTP, FILE, RTSP, HTTPS |
封裝格式 | FLV, TS, MPEG, MOV, M4V, MP3, GIF | FLV, TS, MPEG, MOV, M4V, MP3, GIF, AVI, ASF, MKV, WAV, WEBM, RM |
視頻編碼格式 | H264, H265, MPEG4, MJPEG | H263, H264, H265, MPEG2, MPEG4, MJPEG, VC-1, WMV, RV40 |
音頻編碼格式 | AAC, MP3, NELLYMOSER | AAC, MP3, AC3, AMR, APE, DTS, EAC3, FLAC, PCM, OGG, WMA, COOK, NELLYMOSER |
(2)運行環(huán)境
KSY MediaPlayer iOS SDK可運行于 iPhone/iPod Touch/iPad,支持 iOS 7.0 及以上版本; 支持 armv7/arm64以及虛擬機運行。
(3)快速集成
Step1 集成framework
將金山云SDK解壓后,將framework目錄下KSYMediaPlayer.framework復制到項目下,選擇需要集成的target,在target->Build Phases->Link Binary With Libraries下,將KSYMediaPlayer.framework添加進去,然后添加另外四個系統(tǒng)庫:
l VideoToolbox.framework
l libstdc++.6.tbd 或者libstdc++.6.dylib
l libbz2.tbd 或者 libbz2.dylib
l libz.tbd 或者 libz.dylib
Step2調用
打開需要集成播放視頻功能的視圖源碼,把如下代碼復制并粘貼到你將播放視頻的位置,例如到播放/停止按鈕的方法中。
1.導入頭文件
#import <KSYMediaPlayer/KSYMediaPlayer.h>
2.初始化player
l 準備需要視頻播放的UIView;
l 新建player;
l 設置url;
l 調用prepareToPlay開始播放。由于已經設置shouldAutoplay為TRUE,則prepare完成后立即開始播放。
三、結束語
通過上述的采集、處理、分發(fā)、播放等集成一體的VR直播解決方案,達到了穩(wěn)定輸出的效果,可以在APP和VR眼鏡進行觀看直播。
隨著直播的不斷演化發(fā)展,直播對于各行各業(yè)的影響也在逐漸深入,并逐漸開始從個人走向企業(yè),已經成了一個標配,成為大家傳遞信息的一種新方式。VR將是信息傳遞的下一個方式。VR直播將扮演非常重要的一個角色。它會深入到生活的方方面面,深入到各個行業(yè)里面去,也會慢慢成為標配,未來3到5年,VR直播行業(yè)將會有大發(fā)展,會成為大家日常生活當中獲取知識并與親朋好友交流的一種標準方式。
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經“絕種”了