6月14日,以“空間智能驅動萬物互聯”為主題WGDC2018地理信息開發者大會在北京國家會議中心順利開幕,來自測繪地理信息、北斗位置服務、人工智能、自然資源、空間大數據等行業領域的專家學者、企業代表、高校師生以及行業從業者超過10000人次參會。
15日上午,集團專場峰會——空間地理信息數據高效獲取、應用與服務在北京國家會議中心開幕,會議特別邀請了中國工程院院士、攝影測量與遙感專家劉先林重磅出席,帶來《AR技術與三維GIS的融合》技術分享。 中國工程院院士、攝影測量與遙感專家劉先林作技術分享《AR技術與三維GIS的融合》 以下中國工程院院士、攝影測量與遙感專家劉先林題為“AR技術與三維GIS的融合”的演講實錄(未經本人確認):
劉先林:
各位同志,歡迎大家來這里聽我的報告。前不久中國電子協會邀請我做一個關于這方面的報告,因為我過去做了一些顯示的技術,所以答應了。后來發現VR技術已經向AR過渡了,就是要把實景和虛景相結合,實景就是我們測繪人的長處了。昨天(6月14日)上海搞AR最著名的公司來找我要搞合作,要快速把實景生產出來。AR行業在2015年的時候很瘋狂,到后來就越來越不行了?,F在看起來,能不能把地理信息技術注入進去,獲得新生,希望AR和VR技術進入新一輪的潮流。
地學業者對AR有個定義,說現在空間地理信息數據主要是形的基礎上來疊加各種實時大數據,就是流,使人們對客觀世界有更深刻的認識,這是我們對AR的見解。這個大會包括了三維顯示的報告,我們講的是測繪工作者,立體觀察已經幾十年了,經過了很多次的更新換代。比如說左邊這個立體機,右邊這個就是我們解析測圖儀,解析測圖儀很少,1998年之后就不怎么用了,大家可能沒見過。這個大家非常熟悉,就全數字,這個很流行,全國大概有幾千套。然后多通道的立體顯示,基于GPU的融合技術,我們可以實現這樣的大屏幕的上下融合、左右融合,過去只能是普通三維顯示,做成了可以在立體上顯示,主要的技術就是把顯卡底層的功能專門做一個空間實現融合。融合也不是那么簡單,幾何上要融合起來、光度融合起來、高度上融合起來,要看不出任何的縫。比如說左圖是有三通道的,這三個通道早期都是用雙液晶,最早大家都知道我們是CRT的,CRT的照度非常低,我們花幾百萬、上千萬買過這個比利時的東西,不是很好用,后來全部退掉了。后來我們發明了雙投影、高亮度液晶投影,亮度非常高,其中一個重要的技術就是兩個投影來實現一個立體的投影,同時還要融合,因為一個投影儀的寬度有限的,我們要更大的,整個會場要很震撼的,這個也做了不少,全國所有的地理信息產業部門目前用到的液晶的高亮度的東西。右邊這個用了一個國外的投影,直接人可以沉浸式的,也是國家測繪局用的。
最近新出來的就是LED大屏幕,這個比較新。所有的那些投影儀亮度還是不夠,不能在室外,只能在室內。要在室外看立體就是要高亮度的LED,LED的每一個發光管都是可以表現紅藍綠彩色的板,方便率很高,可以在野外使用。我們目前有兩種方式,一種就是主動立體,就是戴上液晶眼鏡,把這個液晶放在眼鏡上來是可以看到的,戴上眼鏡就能看到立體。另外一種方式就是被動的LED,被動LED戴的不是液晶眼鏡了,目前銷售了第一臺,估計未來在一些大場合,像今天這個LED屏幕還是相當高了,但是不能看立體,給什么眼鏡都不行。我們的測繪人的立體是不需要旋轉的,現在的發展趨勢就是LED。目前LED的立體大屏幕的需求非常大,已經開始出現了,這是最新一代的立體。手機立體也有。 下一步我們提倡一個叫做手機的裸眼立體,手機很有意思,我們年輕的時候看立體有的要拿立體鏡,有的不用立體鏡,直接拿兩個照片折起來就可以,裸眼沒有任何的裝備就可以看立體。智能手機橫過來以后跟我們眼基線正好相等,所以拿來看立體非常合適。所以下一步手機的裸眼立體將會出現,我們也致力于這方面的研究。因此在三維顯示方面,應該說我們測繪人比搞AR、VR的人很高,而且現在還有新花樣要出來,就是手機的裸眼立體,這是我們下一步要提出的。
我們陸部長提出來要把所有的二維系統變成三維系統,因此這就給我們帶來了機會。我們認為所謂的地理信息大數據分為兩種,一種叫做形為主的,一種就是流為主的,一種是時空大數據,一種是實時大數據。我們做的事就是時空大數據,實時大數據很有意思,它是沒有目的的,不知道采集是為了誰采集的,實時大數據可以進入流通領域的,它的時間周期也比較短,甚至于毫秒級在那里采集數據。我們最近采集周期也很快,一般一個城市最快三個月要掃一次,北京就每三個月要拍一次,我們拍了四萬公里,馬上又要開展這方面的工作了,又要拍四萬公里。我們下一步怎么樣?是不是新的冒出來了?又要拍。實時大數據頻率是非常高的。
我們所做的時空大數據分兩種,一種是無結構大數據,一種是有結構的大數據。無結構的大數據實際上不是大數據,它是數據大,我們常常說的這不是大數據。什么叫無結構大數據呢?比如說航片、衛片都是這個東西,最近非常流行的叫做mesh模型,我們芯片機動輒售價七八百萬,今年訂貨很多,國外的產品都沒把我們壓跨。國外的產品比不過我們,今年全部都找我們訂貨了。因此可見mesh模型非常流行,因為它的感官上感覺還是比較好的,但是mesh模型是無結構的,你看到路上的行人、車,你都關不掉,它不分類,更不要說分對象了,所以這種無結構模型的話是可以看、可以感受,它要做出決策的話只能用人腦,而結構化的時空大數據是電腦來產生知識的。要想用電腦產生知識,你所用到的數據絕不是無結構的大數據,而是有結構的大數據。這種數據才叫真正的大數據,才叫做會說話的數據,或者叫做智慧數據。而我們所說的mesh模型都不是智慧數據,僅僅是數據大而已。因此這套技術,我們地理信息界下一步為社會提供的數據一定是這樣的數據,這樣的數據絕對不是工廠化處理能夠實現的,一定是智能化處理才能夠提供的。過去說一流的企業是做標準的,現在不是說了,現在是一流的企業做平臺。
這是一個無結構的三維模型,這個模型很老了。
傳統的測繪遙感數據量非常大,但是要把它由數據大轉化為大數據,必須要用人工智能的技術來對大數據進行結構化,特別是當前流行的深度學習能夠自動的監測、分割、跟蹤矢量、掛接屬性。傳統意義上的深度學習就是監測,能夠找到,找到這里是程序,但是這還遠遠不夠,一定要進行分割,然后在這個基礎上進行跟蹤得到矢量,然后掛接屬性,如果沒有屬性的話是不可能產生知識的。所以說結構化數據第一個就是分層分類,一層層打上來的建筑物。這是我們所要求的結構化的大數據。這是電線的探頭,在你的系統里一定是分開的管理的,對于他們搞虛擬現實的人來說很不可理解,他們做的AR、做的實體模型不分層分類,他們對這個也感興趣,覺得為什么要這樣?昨天專門跑來問我,我給他們講了很多的原理。第一步這個數據一定是分層分類的,哪怕沒有類,大家都混在一起不行。這個就是對象化管理,每一棵樹都有自己的屬性,一定是對象化管理的,這是結構化數據。還有一定要有三維矢量,像是房屋。這些圖形的背后一定是一些文件來支持的,將來計算機能懂讀這個東西,它不用再自己去用深度學習來對這些不會說話的數據進行改造,事先采集的時候就把它搞定了,這中間就Y軸就是對象實體。你要和這些工業部門相結合的話屬性要求非常嚴格。我們可以把幾何屬性都事先做好。這種形式的數據是高級形式的,生產最困難,必須高度自動化,人工是不可能生產出來的。這種數據做出來之后可以生產任何一種低級形式的數據,無結構的也可以做出來。
目前從AR的觀點來看是以感性為主,不是理性的。感性為主的意思就是放在卡上進行一次碰撞檢測,或者前后遮擋檢測,這個就很低級,只能在卡上運算,不能在云上運算,我們要的數據是要在云上進行知識產出,這點對AR是很重要的。昨天跟他們搞虛擬的人講到,我們是搞現實的,虛擬和現實一定要相結合。
當然對于AR數據結構化的數據標準還有待研究,流動的數據,所謂的流分兩種,一種是有形的流,比如說車輛探頭。一種是無形的數據流,比如說數據流、資金流,網購的數據。這兩種流都可以疊加到相對靜止的空間地理信息數據上,使得觀測效果更生動,這就是我們說的熱力圖,所以我們能夠做的事很多。
最后,我給他們講了一下AR技術怎么樣才能再次成為一個潮流,它的核心問題要使受眾達到千萬級,甚至于億級的,我們做一個產品動不動就幾百萬。用戶一年最多銷七臺,但是人家滴滴打車融資動不動上百億美元,因為他的受眾非常廣、非常巨大,你這個AR要想再次成為潮流的話,受眾一定要從少數人變成多數人。
AR的下一步熱點,跟我們地理信息相結合可以做些什么事情?
第一個是4DAR,就是交通部門的探頭。這個探頭的數據量是爆炸性的,警察要想從里面找到一點知識是很困難的,就要用4DAR技術幫助他。因為這個探頭數據里面有大部分的數據都是靜止的,比如說樹、標線、房子,都是靜止的,只要把移動的部分提取出來。每個探頭是有模型的,有它的位置和方位,在這個基礎上就可以把探頭的數據進行疊加,這個就是錄像用深度學習很方便的可以把車找到,過去用這個技術是在街景發布的時候把車牌給隱蔽掉,現在不是了。現在是要把這個車牌用上,沒有車牌的數據無法使用,這是我們三維模型。車上去之后這個模型還可以旋轉,這就是AR現場的實景。也就是通過深度學習的辦法把警察的數據拿出來,把車找出來,把固定場景的東西更真實的表現在上面,僅僅把警察所關心的車提取出來,然后投上去,這就是4D。
如果警察關心人的話也是可以的,這有什么好處呢?就是數據量大的現狀,而且不僅可以看到現狀,還可以追溯歷史、預測未來,看這個車下面要跑到哪兒去。這里面最核心的是移動對象應該是有屬性的,就是說這些移動對象他的車牌號、車型、車的顏色,這都是移動對象的屬性。所以我們的三維對象的話過去有點狀對象、線狀對象、面狀對象、體狀對象,這是我們的對象化管理中的四種。點狀對象比如說電桿,線狀對象是隔離帶,面狀對象是墻,體狀對象是建筑物或者過街天橋?,F在出來了第五種就是移動的對象,這個移動對象在我們的結構里面能改,僅僅是把屬性里面對這個對象要有描述,在我們的屬性里面有它的大寫坐標、小寫坐標、幾何形狀,還要增加它的時間。就是我們過去三維時代的時候,這個屬性里面的幾何對象三維矢量,比如說一個路燈三個點就夠了,一個坐標也是三個點,一個電桿兩個點就夠了,一個房子當然多一些?,F在移動對象的話屬性里面的幾何矢量就增加了,T1XYZ,T2X2Y2Z2,屬性項里面的矢量部分變成了四維的矢量,這就是4DAR結構的數據基礎。如果不是這樣的,警察可以在系統里面調任何時刻、任何地點的場景,任意時間、任何地點、你所需要的任何對象的場景,可是周圍的一切東西都是真實的。把干擾的車也可以去掉了。
這是第一個“熱”,我們預計在國家公安部門大量的探頭數據量爆炸的情況下,將會有這個“熱”支持AR技術進一步的發展。當然AR技術可以在手機上發布,也可以在LED上發布,也可以在網上發布。
第二點就是手機上的立體觀察,因為手機的數據量有限,目前要都從網上下載的話,你在網上下載一個帶紋理的模型數量會很大。那么怎么辦呢?最近我們就搞了一個數據量幾乎為零的,幾乎可以忽略不計的,叫做“白膜”。這就是一個“白膜”,當然這里面把建筑物關掉了,當時做得還不是很成功,完全用激光,不用影像就可以把“白膜”輸入進來,做好之后它的數據量幾乎可以忽略不計,用本地數據就可以漫游,但是標線、路桿、天橋都是真實的,雖然沒有用影像,但是也足夠讓人看到這一切。所以這種“白膜”做出來以后就有可能在手機上進行漫游,這個我們認為是AR的下一個熱點。
這個“白膜”做出來之后有什么用呢?首先一個就是可以作為自動導航,給他們注入一些新的血液?,F在的導航軟件當然也有三維,但三維基本上都是虛假的,跟真實的情況不一致。我們現在雖然不是真實的紋理,但是基本上形狀是真實的,因此從過去所謂的百度、高德這些自動駕駛的軟件中注入這樣的東西,就是所謂的實體導航。實體導航有什么好處呢?第一個好處就是到了目的地之后可以找到真正要去的地方,而不是走錯了。現在因為北京搞拆違建,把大廠商和賓館的標志都拆了,所以到了目的地之后導航結束了你也找不到要去的地方。因此這樣的實體導航就可以把你的目標所處在的路口,或者是建筑物進行渲染,渲染成另外一種顏色,你這樣就很容易的在最后100米的時候找到你要去的地方,這是一個模式。另外一個就是實體定位,假設我們把這個街區所有的“白膜”都建起來,這個“白膜”建起來并不是很復雜,只要車開過去數據拿回家,第二天早上就出來了,這個就靠云計算,靠GPU,第二天早上就可以拿到“白膜”,基本上八九不離十,應該說基本上不用編輯了。這樣的數據對于未來的實體定位提供了一個基礎,現在的定位潮流很多,現在的地基增強、藍牙定位、基站定位,這些都是無線電定位,跟我們搞測繪的沒有關系。但是我們搞測繪的下一步會推一個實體定位,我實體都做出來了,你拿我就可以了,當然也不是圖像定位,圖像定位的話信息量太大。所以我們測繪工作者在定位的技術上可能會有新的思路。
第三個熱點,就是AR車窗的自動駕駛。也就是說在國外是有這個想法的,還沒有完全實現。會上有一個公司說他可以做AR車窗,AR車窗就是在車上可以既把你計算機里面的實體街景的模型投影到屏幕上去,同時你又可以從,AR車窗是一個透明的,可以看到地面、看到實景。這兩者結合起來對于自動駕駛,對于駕駛的樂趣會提高。一方面你的數據是不是對,就可以知道了。另外一方面你自動駕駛的路線是不是對,如果不對的話一定是模糊的。因此AR在移動物體,包括人當中都會很有用,過去的頭盔都是VR頭盔,目前所看到的都是VR頭盔,這個VR頭盔看不到自己的身體,也看不到地面,用戶用一會兒就頭暈。因此提出來一個AR頭盔的概念。而AR頭盔要想推廣的話,那就離不開我們搞測繪的人了,因為它要實際模型,實際模型由誰提供呢?就是靠我們測繪人提供的,所以我們在這個當中的應用是有很多場合的,雖然我們是跨界融合碰撞了一下,最后反響還是很好的。十多個人來加我的微信,我為什么在這里做報告呢?就是希望我們測繪人不要局限在過去的二維、三維,現在是四維時代了。也許這個會來的很快,把AR技術和我們現有的采集技術結合起來,我們現在做的數據就要求非??茖W的,將會在馬路上每隔200米就修一個5G的基站。剛才我們四五十類的路線都可以全要素的采集出來,這點是有基礎的。但是客戶提出來的一個需求,你采集了之后我怎么知道它的變化?是不是再采一次?我現在初步的思路還不是這樣的,而是用電子標簽,用RFDI的技術實現動態的監測,因此我們測繪工作者的服務面,雖然我們測繪局現在定到自然資源部去了,但是服務面是非常寬的,幾乎沒有一個行業能夠不用我們的技術。所以我們測繪地理信息工作者是在新一輪的創新大潮中大有可為。我的報告就到這里,謝謝。