算數和算命有什麼區別,數字算命的方法與運用

所謂「預測」,統計學上的精確定義是:對事物發展趨勢和在未來時期的數量表現做出推測和估計的理論和技術——它是一個概率結論。

可是當你在百度上搜索「預測」這個關鍵字時,會出現好幾頁的結果都是五行、八卦、星座、塔羅牌。這可能就是真實的預測和多數人眼中的「預測」之間的差異:

一個算數,一個算卦。

聊聊概率結論的不確定性

人們總是喜歡確定的因果關系——「因為A 所以B」,並且認為數據自己就可以表達出這種因果關系。

可惜的是,這個世界是由概率組成的,幾乎不存在「因為A 所以B」,存在的只是「我們考慮A 這個因素,有30% 的概率可以得到B;我們考慮C、D、E、F、G、H、I、J,有70% 的概率得到K。」甚至多數現實比這個更複雜。

而定量分析的預測方法的選擇和預測結果通常與以下幾個因素有關:目標、時間期限、精度要求、費用預算、數據的完備程度與模型的複雜程度、歷史數據的形狀。

比如:戰略性決策對精度要求較低,則使用中長期預測方法;業務決策,要求精度較高, 則使用短期預測方法;精度越高的模型需要的工作量越大、費用越高,等等(參考《預測與決策》一書,西安電子科技大學出版社)

關於「預測」的例子非常典型,能夠充分說明「數據」在商業化的道路上被「妖魔化」了。

這種現象的本質是,「概率結論」很難被非統計學專業的人理解,甚至完全被充要關系或線性的因果關系替代。

關於這種現象,《不確定世界的理性選擇: 判斷與決策心理學》一書給出了一個非常有意思的研究結果:即使是受過系統化概率論思維訓練的人群,也會嚴重低估未來的隨機成分,並且更喜歡確定的結論,甚至認為彩票可以有方法通過計算提升中獎概率——被試即使有「隨機獨立性」的概念,也會不自覺地認為彩票的結果會和歷史結果相關。這是一種極端的情況,也是實驗的非常好的場景——彩票的每一期的中獎結果都是獨立的(和歷史的相關性為0)。

那麼在日常應用中,這種偏差就更顯著。另外,這本書在介紹關於彩票預測的心理學實驗之後講了一個非常有趣的故事,一個西班牙人中了全國彩票後,記者采訪他是否有什麼秘訣?他說:「我刻意選擇了尾數是4 和8 的彩票,因為我連續7 個晚上夢見了數字7,而7 乘以7 等於48。」

那麼當業務人員提到「預測」兩個字,我們就要開始搬出ARIMA 模型、貝葉斯定理或者馬爾可夫模型嗎?

答案當然是「不」

科普預測的原理到底是什麼?作為數據產品經理要理解最基本的統計學知識和數學建模方式,用於做一些專業判斷,但是千萬不要動不動就去給業務人員科普統計學常識,畢竟術業有專攻。更何況,業務人員說出的「預測」和你腦子里複雜的統計學知識可能根本就是兩件事。於是這就變成了一個溝通問題:先搞清楚業務人員講的「預測」到底是什麼。

不確定感帶來的焦慮

如果你做過某個零售類業務的數據分析師,那麼對預測一定不陌生。在成熟的業務體系下,多數情況我們都會沿用之前的某個非常穩定的預測模型,在一些特殊事件發生時再引入新的參數更新模型——這是因為有足夠的歷史數據支撐。

但是模型提供的只是一個可能性:它表示「基於歷史狀態,如果不發生任何特殊事件,那麼大概率會朝著這個方向走」。這種預測的實際意義通常和零售業的預算、備貨、原材料和輔料準備等實際業務訴求相關,也就是有很多具體的業務行為是需要參考這個模型的。通常也只是參考,並不會完全依賴。業務人員還需要考慮所處的階段和打法(激進的還是保守的)、市場環境(主要競爭對手是不是即將有大動作)、上下游配合(合作的大渠道今年是不是有動作)等等因素。甚至在很多時候,預測值只是一個目標(Flag), 給業務人員形成一種心理暗示。

如果在業務體系並不成熟的公司,那溝通的第一個目標,問明白這個預測值對應的業務行為是什麼,或者說這個預測值會怎麼影響業務行為。當無法判斷確切目標時,多數業務人員在說出「我需要一個預測值」時,表達更多是對未來不確定性的焦慮。這時需要詢問業務人員對已有的事實數據的了解和使用程度,思考已經提供給業務人員的事實數據是否是足夠的。最大的誤區莫過於,對方說出「我需要一個預測值」,數據產品經理就立即陷入了如何預測的思考里。

充分描述歷史數據

業務人員會由於信息過少而感到焦慮,很大程度是由於報表體系對歷史數據的描述不完整,而不是缺少一個所謂的「預測值」。

歷史數據是否被充分描述了?換句話說,就是指標體系的搭建是否已經足夠精細, 並且落地為多維度的報表?數據源和數據質量是否能完全支撐業務的基礎訴求?報表是否可以更精細?(關於如何構建指標體系和報表的維度可參考《數據產品經理新人的工作筆記》第4章)

工作筆記:一個需求溝通框架

這個框架主要用於需求方發起一個需求後,雙方需要溝通的情況下。這里需要注意區分「需求溝通」和 「會議」之間的差異。會議的目標是就某一件事有決議,而需求溝通——尤其是初次溝通的目標,是充分挖掘並記錄業務人員關於這個需求的信息,將你本人非常明確的內容做出反饋,盤點待確認信息並告知對方。

在溝通前,需要準備的內容如下表。

在溝通中要仔細記錄,如下表。

上表可能會在多次溝通中才能填寫完成:前8 項填寫完成,最後一個「待確認信息」,才叫作需求確認。

在溝通中,請務必確保業務人員明確的內容為需求流程和涉及的審批流程。

在溝通後,我們要完成「待確認信息」的確認和反饋。經過充分溝通後,「待確認信息」中沒有了業務邏輯的部分,只剩下技術方案相關的問題,即認為是可以輸出PRD 的狀態。而上表的藍色部分,就是PRD 主體部分的主要依據。

以上內容節選自新書《寫給數據產品經理新人的工作筆記》

《寫給數據產品經理新人的工作筆記》是資深數據產品經理10餘年工作經驗的精華提煉,為數據產品從業新人或準備轉行做數據產品的讀者提供了一個本領域的通解通法,並對即將面臨的問題做出預判,並找到解決方案。行文簡潔、幽默、富有邏輯,不僅可以成為數據產品經理的工作手冊,而且適合業務層面的管理者、決策者閱讀,可以幫助讀者理解如何讓數據更好地為業務服務。

作者簡介

热门内容