作者 | Niccolo Mejia
編譯 | CDA數據分析師
What is Predictive Analytics? – An Informed Definition
預測分析可能是金融機構,銀行,保險公司和醫療保健公司使用的最常見的AI應用程式之一。這種類型的軟體使這些行業的業務領導者可以規劃信貸,貸款和患者健康等業務領域中最可能的結果。預測分析軟體可以使用歷史企業數據根據典型的公司經驗對未來的業務事件做出預測。
在本文中,我們定義了預測分析,並展示了該領域專家的其他定義。我們介紹了AI和ML如何幫助預測分析用作商業智能工具的背景。此外,我們還提供了一個示例性預測分析供應商的示例,以及該公司的AI解決方案據稱可以如何幫助各種行業的客戶。我們對預測分析的解釋始於我們自己的定義,以及上下文說明軟體如何從機器學習]算法中受益。
什麼是預測分析?
預測分析是一種工具,用於使用企業數據來預測組織所選業務領域中的變化。這使組織可以根據組織過去觀察到的現象計劃最統計上可能的結果。
預測分析並不總是AI
當預測分析由機器學習模型提供支持時,它就是一類AI軟體,但這在最近幾年才變得越來越普遍。在此之前,術語「預測分析」是指使用多種不同的商業智能技術來確定最可能發生的未來事件。
但是,這些技術並不複雜,無法提供表明最可能結果的置信度得分或統計百分比。取而代之的是,使用企業數據來創建預測模型,該模型僅顯示軟體如何得出結論以及為何可能發生預測結果。
機器學習如何使預測分析變得更強大
由機器學習提供支持的預測分析應用程式具有利用大量數據並基於該數據做出更準確預測的能力。機器學習能夠處理更大的數據集,因為它需要儘可能清晰地顯示組織業務歷史的圖像才能正常工作。一旦對機器學習模型進行了與組織所選業務領域有關的數據的培訓,它便可以自動化用於進行預測的分析技術。
這些預測通常包括一個最可能的結果列表以及一個置信度分數,該置信度分數指示基於軟體估計的預測的準確性。如果軟體做出的預測得出的置信度分數低於某個特定數字,它將不會將該預測發送給用戶。此置信水平通常設置為很高的間隔,例如90%或92%。重要的是要注意,為預測分析應用程式訓練機器學習模型需要大量的結構化數據以及試用安裝時間。這等於將結構化數據輸入到機器學習模型中,直到能夠識別客戶組織業務中的趨勢和模式為止。
一旦模型可以識別重要的信息類型,例如索賠額或醫院再入院,組織將需要將其集成到其技術堆棧中並允許其在後台運行。在這段時間內,機器學習模型將像使用舊數據一樣進行訓練,除了業務的當前事件。業務主管可以在這段時間內檢查軟體的預測,以觀察其不斷提高的準確性。例如,用於預測客戶流失的預測分析應用程式將需要在大量歷史數據存儲庫上進行培訓。然後,需要將應用程式安裝到客戶公司的網絡中,並允許其運行試用期。試用期結束後,該軟體應能夠在真實的客戶行為與客戶流失的歷史原因之間建立關聯。這樣,它就可以預測單個客戶是否會留在客戶公司。
創建了預測分析應用程式的供應商通常會說明需要進行多長時間的試用,並且如果客戶希望繼續使用該軟體,它將已經部分安裝。
專家定義
「預測分析是一種從經驗(數據)中學習以預測個人未來行為以做出更好決策的技術。」 – 預測分析的作者:埃里克·西格爾(Eric Siegel):預測誰會點擊,購買,說謊或死亡的力量 預測分析是…不同技術和領域的結合。基本上,目的是根據過去的歷史事件來預測將來的事件。…如果我們將其與Google Analytics(分析)進行比較,那只是在研究數據。預測分析,有一個自動預測因素「[為其解決問題。 - 德國桑奇斯-Trilles,CEO和聯合創始人Sciling信息技術和服務。 預測分析將高級統計功能結合在一起,包括臨時統計分析,預測建模,數據挖掘,文本分析,優化,實時評分和機器學習。這些工具可幫助組織發現數據模式,而不僅僅是知道發生了什麼,還可以預測接下來可能發生的事情。-–- IBM
供應商聚焦:Dataiku
Dataiku是一家成立於2013年的紐約創業公司。他們聲稱已創建了機器學習技術,該技術可以分析原始數據以構建多種格式的預測模型。該原始數據可以採取來自客戶交互的單個產品或銷售記錄的歷史交易的形式。Dataiku聲稱他們的AI軟體可以幫助企業識別某些數據點之間的關係,從而可以提高效率和降低公司支出。富國銀行等主要銀行每天都會生成大量原始客戶數據,這些數據可能來自客戶對話,社交媒體帖子,網站活動,營銷活動和交易信息。處理這麼多種不同的數據類型的能力可能為銀行客戶帶來以下好處:
- 市場部門或欺詐檢測團隊可以通過儀錶板訪問新的見解,該儀錶板會提示員工有關新數據中任何異常的注釋。
- 收集,清理和分析原始客戶數據的能力。這將使客戶公司能夠深入了解社交媒體帖子與市場營銷活動銷售之間的關係。公司可能會藉此了解趨勢並預測尚未開發的市場。
- 此外,國際交易和客戶互動中的模式可以幫助客戶識別欺詐行為並開發更嚴格的預防技術。
當Dataiku用戶登錄系統時,他們可以上載要由軟體組織的數據。Dataiku聲稱數據以電子表格的形式顯示並自動組織。該軟體會將每個數據點與它在新集成的數據中檢測到的某些共同特徵相關聯。因此,當公司表示可以檢測到特定數據是與男性還是女性客戶相關聯時,它們意味著該軟體已經為某些客戶行為建立了性別關聯。此外,每列頂部都有一個比例刻度,以便傳達與該類型數據相關的缺失值的數量。
然後,用戶可以單擊每列的標題以可視化數據,這可以使他們以圖表或圖形的形式查看此數據。據稱,它們還可以生成交叉引用不同列的圖形。如果用戶認為數據中可能存在異常值,則軟體可以提示用戶如何更正它們並進一步培訓軟體。以下4分鐘的視頻是Dataiku的演示。這顯示了企業如何使用此預測分析應用程式來編輯,監視和查看從原始數據中收集的見解。
行業用例
醫藥品
預測分析在製藥行業中最突出的用途之一是臨床試驗的設計和優化。這樣的應用程式可以分析患者的病史,以確定哪些患者對被測藥物的反應最佳。這有助於公司找到最好的患者來嘗試招募參加臨床試驗。這種類型的軟體解決方案還可以幫助製藥公司以多種其他方式設計和組織臨床試驗。這些研究包括該藥物可能產生的副作用以及哪些患者最有可能經歷這些副作用的研究。另外,一些應用可以允許遺傳聚類,或根據患者對藥物反應良好的可能性進行細分。
以下是供應商Dataiku的演示視頻,展示了他們稱為DSS的軟體平台。該演示將引導觀眾完成用戶使用數據集來預測醫生使用不同藥物處方的過程。儘管視頻長13分鐘,但最重要的部分也列在下面:
- 演示者在0:00時首先找到他們要進行的預測所需的數據集
- 演示者在2:30解釋了數據實驗的目標,並結合了先前獲取的數據集以檢查是否有矛盾。
- 6:30顯示了演示者加入數據集並「清理」數據集之間的任何不一致之處。對於此特定實驗,演示者需要確保準確顯示所有醫生的ID號碼,或找出丟失某些ID的原因。
- 8:25是演示者將所有相關信息填充到單個表中的時間。在這裡,他們可以找到某些行,可以將這些行合併為細度稍低的類別。
- 最後,9:58演示了演示者如何獲取所有經過整理和整理的數據,並使用它為每個醫生的處方創建和預測模型。
衛生保健
醫療保健公司可以使用預測分析應用程式來幫助防止患者再次入院,預測患者健康狀況下降以及預測患者錯過約會的可能性。AI供應商Health Catalyst提供了一種解決方案,他們聲稱可以使用患者的病歷作為數據來完成所有這些任務。
集成後,醫院可以登錄Health Catalyst儀錶板並顯示患者資料。該個人資料將以百分比的形式顯示患者患上重病,錯過約會或以後被重新接納的可能性。這可以使醫療保健提供者密切關注由於忽視健康而處於較高風險中的患者。
金融服務
預測分析可以幫助金融機構預測與貸款或發行信用卡相關的風險水平,包括客戶違約的可能性。這對於嘗試通過增加活躍貸款的數量以及每筆貸款的數量來進行增長的機構特別有用。當這些貸款以信用卡的形式出現時,機構可能需要一種策略來預測與每個申請相關的風險。
預測性分析應用程式可以使用申請人的信用評分,信用歷史記錄和整體財務歷史記錄(如果有)來計算此結果。此外,這種信用風險評分可以幫助金融機構實時識別不正確的付款金額。這可能會增強機構在完全處理欺詐性付款之前的能力。
保險
在保險業中,支持機器學習的預測模型可以幫助企業防止客戶流失,從而使客戶保持更長的時間。某些應用程式可以根據客戶為保險公司提供的終生價值來對其評分。這種類型的應用程式對於尋找向這些客戶進行營銷並吸引他們提高保險計劃的新方法可能很有用。
保險公司可以不使用客戶的個人金融行業,而可以簡單地利用與客戶的歷史和交易數據來估算他們將來將繼續提供多少價值。可以認為是客戶流失的證據的數據可能是客戶使用保險或與客戶服務進行溝通以更改或改善其計劃的頻率。
掃碼進入CDA官方小程序,解鎖更多新鮮資訊和優質內容,還有免費試聽課程,不要錯過喲!
文章來源: https://twgreatdaily.com/zh-hk/mqEnEW8BMH2_cNUgCeDB.html