服務熱線
86-132-17430013
品牌 | 其他品牌 |
---|
西門子代理商 包頭西門子代理商 包頭西門子代理商
全球各地產生的數據量正在急劇膨脹。根據市場調研機構國際數據公司(IDC),數字宇宙,也就是世界范圍內全部以數字方式存儲的數據,在2010年首次超過了一個澤字節(ZB,即1021字節)。IDC預計,到2020年這一數字將會增至35ZB。假如把這些數據全部存儲在DVD中,這些DVD堆在一起可以在地球和月球之間打個來回。在增速較快的數據中,主要可以分為被稱為元數據的大量數據集合體,即書籍和數據庫,以及非結構化的數據,比如結構未定義的任意文本和圖畫。數字宇宙中大約三分之一的數據是高質量信息,也就是需要遵循安全、合規和存儲規定的數據和內容。IDC預測,到2020年,這種數據將占到全部數據的二分之一左右。
日益復雜的數據越來越多,必須對其進行高效的處理。然而,如果沒有電腦幫忙分類、分析、壓縮數據,并準備好給人類使用,這一切都是不可能實現的。學習系統在這方面非常有用,因為它們可以從例子中學習,識別數據的模式并使用這類信息去預測未來的發展趨勢。機器學習的應用十分廣泛多樣——從市場分析和工業設備的預期維護到醫療系統的診斷方法等不一而足。在很多這類應用中,重點是識別聲音、文本和圖像模式的技術。
例如,語音識別系統被用來駕駛車輛和電話自動開關機、樓宇和辦公技術管理、工業生產質量保障以及醫療診斷等。Datamonitor公司的市場研究人員預測,這些領域的數據將高速增長。例如,他們預測手機的高級移動語音識別系統市場將從2009年的3,270萬美元銳增至2015年的1億美元,差不多增長三倍。根據這些專家的預測,同一時期,車載語音識別系統的銷售額將從6,430萬美元增至2.082億美元。
這類語音識別系統早已不是什么新鮮事。據市場調研公司Gartner集團2011年發布的一份研究報告,語音識別技術其實屬于1995年關于相關技術發展趨勢的“炒作周期”的一部分。但是這類系統的有效性還有待提高,主要在于電腦面對的最大挑戰之一是識別口語。主要原因是電腦還沒有足夠廣泛的日常生活的知識,只有擁有這種知識,它們才能夠真正理解人們所說的話。
學習系統還可以被用來分析圖像和錄像。這種系統對工業圖像處理特別有用。歐洲機器視覺協會(EMVA)因此預測,該市場在2011年的增長率將會達到20%,而2010年這一數字為11%。雖然產品檢驗和質量保證仍然是工業圖像處理系統較常用的領域,但是,例如在機器人三維視覺系統中,也在引入新技術。這些技術包括汽車視頻系統和安全解決方案,等等。同時,模式識別在醫療工程中越來越重要。企業咨詢公司Frost & Sullivan指出,在過濾和處理關鍵信息方面,醫生越來越依賴學習型軟件。這些信息一般來自*的數字成像設備,如計算機斷層掃描、核磁共振斷層掃描儀及超聲系統。例如,這種軟件可被用于乳房X射線檢查,還可被用于肺癌、胰腺癌和腸癌診斷。