《福布斯》近日發表了DataVisor維擇科技創始人兼CEO謝映蓮的觀點,她闡述了推動下一次大數據浪潮的動力不是“集中數據”,而是“集中智能”的能力。“集中智能”指運用有效的工具優化企業各部門的工作流程,運用先進的特征工程直接從原始數據中獲取智能見解并輸出有預見性的決策。
▽以下為原文譯文
數據對現代數字經濟的運作至關重要。但是,僅有數據并不能自動轉換為可操作的智能能力,也不會自動推動數字經濟繁榮發展。想要在全球數字經濟中取得成功,除數據外,還需要先進的操作工具和解決方案,從而大規模獲得可行的智能見解。
當前,不少企業仍停留在用大量集中式的數據驅動企業發展的階段,但是,從數據安全和隱私保護等角度出發,我們應該從“集中數據”向“集中智能”過渡。
2015年,IBM指出:“當今世界90%的數據是在過去兩年中創建的。”回頭看這段數字化之路,我們提升了數據解釋、創建數據圖表、圖形和可視化效果的能力,同時也增強了數據分析能力。為了在企業級利用這些能力,我們還開發了集中式數據分析方法使企業和機構能夠受益。
如今,AI和機器學習等變革性技術快速崛起,智能能力也隨之變得異常復雜,同時,“集中數據”和“集中智能”之間出現了溝壑。在“集中數據”階段,我們仍在進行可視化的數據管理和數據分析解釋,努力找出趨勢并嘗試理解它們。當我們進入到“集中智能”階段時,意味著數據不僅停留在解釋階段,“集中智能”能夠預測性地創建可行的智能見解,并有效采取大規模實時的行動。重要的是,可操作的智能位于系統內部,它是集中式的。
什么是集中式?集中式不是一個新概念。數據規模和復雜性的快速增長使企業難以管理自己的信息。因此,企業往往朝著集中團隊、工具和流程的方向去發展。表面上看,集中式代表了企業對大數據增長趨勢的積極應對。不少企業在實現降本增效的路上努力,并取得了不同程度的成功。但實際上,還有一些企業停留在只“集中數據”而不是“集中智能”的階段,而“集中數據”的成本和效率收益仍然有限。
鑒于當今數字經濟的需求,數據安全的壓力和用戶體驗的競爭都在不斷增加。大數據智能已成為當代最有價值的商品。但對于大多數企業而言,“集中智能”仍然是一個遙不可及的目標,主要原因是許多企業普遍缺乏先進的特征工程的能力。特征工程對于構建智能系統至關重要。特征能從大數據中發掘出的可行見解,這些見解轉換為智能來供AI算法使用,也就是說,通過特征來釋放出大數據的力量。
那么,為什么先進的特征工程尚未得到廣泛的應用呢?因為特征工程必須手動完成,這是一個復雜且耗時的工作。在迎接各類業務挑戰時,需要大量有效特征去應對,這是個很難克服的困難。
實時生成高質量的特征需要大量專業領域的知識,來自專家豐富的經驗能夠支持特征工程輸出特征的價值、適用性、相關性,并且還能對操作進行有效優化。除此之外許多因素影響著特征工程的質量和效率,比如,在準備好生產就緒的代碼之前,數據科學團隊和特征工程團隊需要詳細溝通;復雜特征的創建需要考慮可擴展性;大規模獲取智能見解也需要耗費大量內存等。先進的算法帶來了巨大的復雜性,對數千個數據點進行實時全面分析,在流程上仍需進行大量優化。
如果一個系統仍舊依賴于手動操作,該系統是無法真正實現智能的。對于企業來說,要提高模型性能、提升效率、優化靈活性并采取實時行動是至關重要的,同時,企業內不同團隊的能力和獨立性也非常重要。這意味著:自動化和定制之間的平衡將很關鍵。
如果某個領域的專業知識可以被應用在處理特定業務問題上,那就意味著一些標準化特征也有機會被應用在自動化模型的構建。通過自動化的能力,直接從原始數據中獲得新特征。比如,在欺詐檢測領域中,影響檢測精度的關鍵特征是IP地址,如果能從原始數據的一個IP地址中自動提取可用特征,那自動化能力、準確性和效率都將大大提高。
先進的特征工程本質上是“集中智能”在實踐中的體現。因為它代表了一種高效、大規模地從大量眾多來源的原始數據中集中提取可操作的智能見解的能力,并且這些智能見解能夠實時對其他諸多領域產生積極影響。
重塑企業的大數據系統,既是縱向的過程,也是橫向的過程??v向角度來看,“集中智能”的目標是使組織中的每個團隊都能利用數據做出貢獻,并獲取智能見解。橫向角度看,“集中智能”需要在所有相關用例和業務場景中實現集中智能風控的目標。
先進的實時特征工程能推進企業的現代化進程,加速并優化企業的風控模式,從而確保更安全,更高效,更繁榮的數字經濟發展。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
標簽: