大數據不需要你的網路日誌,問題不用問你本人,也知道你會如何回答。
《本文開始》
二重身(doppelgange)是德語,源自於德國的民間傳說。都市傳說中(二重身)是指與活人一模一樣的另一個人,不僅和你完全長得一模一樣,連想法、動作和穿著都一模一樣。據說一個人遇見了二重身就死定了,沒有人願意遇到自己的二重身。
如果有二重身,對外來刺激的反應二重身和本尊也一模一樣。
你以為二重身是虛構的,大數據Doppelganger Search採用一種KNN(K-Nearest Neighbor)算法,找出K個最臨近的二重身樣本來預測你對特定刺激的反應。
美國職棒球大聯盟決定和一位28歲某球員簽三年約前,先從有史以來近兩萬名球員的數據中找出20多個二重身,包括身高、年齡、走位、本壘打、平均打擊率和每個賽季的表現...等等各種數據維度上都和某球員高度接近,輸入參數,輸出二重身在29∼31歲期間的產出價值,來評估簽約的風險。
即使你是剛剛才註冊成為新會員,如Google、臉書、亞馬遜、Netflix...等等平台也能利用二重身算法來影響你的決定。
技術應用有好有壞,也非中立。
有的醫院利用二重身算法,找出最適合特定患者的治療方式;也有醫院用來報價,開出患者付得起最大值的帳單。
復旦大學有位教授做了一個“大數據殺熟”的調查,他花5萬元打了800多次網約車,發現手機越貴,被收取的打車費越高;也發現蘋果手機用戶被較貴的車型接單的機會特別高,享受的優惠卻更少,時間延誤的比例因而最高!
平台有大數據,利用二重身算法殺熟效率高正是增加營收的有效技術,平台不用才怪?部分保險公司就利用二重身算法,來推薦顧客最高願意承受的保費。
聽說賭場也應用大數據,每個賭徒都有自己的“放棄點”,只要還沒輸到放棄點,輸多少賭客都不會退縮,今天輸了明天還來。一旦超過放棄點,賭客會放棄翻本的機會,賭場許久等不到這個顧客。
賭場有臉部識別和顧客關係數據庫,不但保存了顧客的年齡、性別、郵編、行為規律、進出場記錄...等等數據,電腦當然也知道賭客實時的輸贏狀態,如果知道其個別放棄點,賭場公關就有辦法讓顧客留在賭場越久越好,二重身算法就發揮了功效。
據說,當顧客輸到差不多了,賭場經理會走過來:『大哥,今天手氣好像不太順利,這是牛排館的優惠券,您先帶夫人去享受一頓頂級燭光晚餐吧』。
恐怖吧?
有了二重身算法,沒有你的任何網路偏好記錄,也能算出你的慾望、潛在需求和反應。
隱私是20世紀的古董,今天沒有這玩意兒。
《end》
|