1/17/2013

少年PI的奇幻漂流

躺在病床上, 看著這本近來因電影而爆紅的書, 頗有趣的, 也耐人尋味。
故事從作者到印度尋找靈感, 來到一個古城市遇到一位商人, 他推薦作者到加拿大去拜訪PI PATEL, 描寫這個傳奇的故事。作者這本書就包含了 PI PATEL 敘述他的年少生活, 接著大篇幅描寫PI 和動物們在太平洋上飄流227天的經過, 最後作者蒐集日本船運保險公司的調查報告, 來證實確有其事以及對PI的故事的質疑, 然後把真真假假的疑惑留給讀者。
第一部分, 關於PI的年少生活, 他提到他信仰了三種宗教(印度, 基督和伊斯蘭), 她探討三種宗教的意義, 他也從他父親的動物園中學習不同動物的可怕之處。但有趣的, PI對動物的性格有特殊的觀察, 頗適用於解讀人性。他認為動物的本能, 就是求生存, 而且動物喜歡保有自己的地盤, 因此掌握這個原則, 只要滿足他們的食物和溫飽, 不要無故侵犯他們的地盤, 他們會很樂意的居住在動物園內或馬戲團, 動物很懶惰, 只要接受了你是老大, 他們就會順從, 老大給他們溫飽, 他們就乖乖的。
第二部份, PI他們的貨輪在太平洋沉沒了, 他來到一艘救生艇上, 救生艇上原本有斷腿的斑馬, 儠犬, 猩猩(別名橘子汁), 老鼠, 蟑螂, 和孟加拉老虎(別名Richard Park, 本是捕捉到老虎的獵人名字, 印度的官員疏忽就把它叫做這名字), 在飄流的前五天, 儠犬吃了斑馬和猩猩, 老虎吃了獵犬和老鼠, 蟑螂。PI在船底找到救生物資(124瓶水, 32份口糧, 探照燈, 海水淡化器, 雨水蒐集器, 魚叉, 小筏....)但這些東西並無法支撐太長的漂流, 而且最困難的是如何和老虎和平共處。PI利用觀察法, 以及智慧, 掌握老虎的生存需求(水和食物), 並且設法讓老虎相信他是老大(他清理老虎的糞便, 讓它可以主導老虎的地盤, 他嘔吐在底盤邊緣讓老虎知道不可侵犯, 他用海龜的殼製作盾牌, 和老虎搏鬥5次, 讓老虎知道他的決心, 最重要的是提供老虎源源不絕得食物), 他抓海龜, 喝海龜血, 抓鯊魚,大分的都給老虎吃。他餓的時候, 他會瞪著老虎, 他相信, 貓科動物不會在你瞪著他的時候攻擊你, 他和老虎在和平共處中度過, 後來在墨西哥海灘登陸, 老虎並不回頭看他, 就跑進叢林裡走了。他很難過, 覺得動物無情!
第90章和92章很特別, 可能是夢境幻影, 也可能有其他的寓言, 90章提到她們漂流到後來, 眼睛瞎了兩天, 這兩天有一位法國口音的人很會作菜, 法國人說他殺了1男1女, 他也是吃海上的魚肉海龜,他和PI稱兄道弟, 談了很久, 但不知道為什麼, 老虎吃了這個法國口音的人, 等到PI眼睛恢復, 他看到另一艘船和法國人的殘骸, 但看不到人了! 92章提到他來到一個植物小島 ,沒有沙灘沒有土壤, 只有海生植物構建成的島, 島上有一座山,山坡有一棵綠樹, 但不是長在土地上, 很奇怪。PI盡情的吃海藻, 也順利的排便, 但他與老虎夜裡還是回到救生艇過夜, 因為那是地盤, 他們爬上山頂(5~60 feet)看到整個綠藻的島, 看到很多湖以及上百萬支會站起來的沼狸, 這裡有許多淡水池塘是綠藻淡化海水來的, 沼哩則快樂的吃掉池塘裡的海魚, 老虎在這裡大開殺戒, 吃了很多沼裡, PI則在這環境調養好身體, 並且時時注意要控制老虎, 不要被他忽略了地位的尊卑, PI 喜歡這裡, 他睡說在樹上, 他發現沼裡晚上都爬到樹上睡覺, 而每天晚上池塘會出現許多魚, 但天亮前就被吃光, 原來這些海藻在夜裡透過吃魚來形成養分, 他們吃過人類, 把人類的32顆臼齒分別包覆在果子, 然後共同消化, 原來這是食人島, 是植物會吃人!
第三部份是日本交通部官員來訪問PI, 了解PI的過程, PI講了他的故事, 但是岡本/千葉先生不相信, 認為PI說謊,
於是要PI將另一個故事, 這個故事類比前者, 那天船沉了, 有四個人在船上, 法國廚師(獵狗), 母親(星星), 斷了腿的中國水手(斑馬) 和PI (老虎), , 水手死後, 廚師把它分解晒乾當作食物, 母親不忍心和廚師起衝突, 被殺死, 處是殺人後很後悔, 就自願被PI殺死。至於船難的原因, 沒有答案。
這兩個故事, 日本調查員最後選擇前者。




1/13/2013

Big Data 在數位行銷的應用

Big data在近期被大幅度的渲染, 似乎講到這個辭就變得很專業。
我在數位行銷的領域, 涉獵一短時間, 我發現許多人把data mining, data warehouse 和 big data混在一起。他們以為, 只要是大量的, 只要是雲端運算的, 都叫做big data. 錯!
以數位行銷為例子, big data 處理的資料是非結構性的, 也就是無法先做分類管理, 也無法根據蒐集完的資料, 慢慢分析後, 再轉拋到系統上去執行。反之, 是利用及時的資料, 在非結構化的分析下, 採用多元變數去找出關聯性, 並透過關聯性高低, 進行行為預測, 立即進行反應, 然後再進行修正。
舉例來說, 以下是兩種不同的做法, 前者是data mining, 後者是 big data prediction.
A聯播網, 將客戶過去的廣告點擊資料, 根據user ID, 對應不同類別的廣告訂單 & 廣告頻道, 尋找規律性, 然後當下一個訂單投放前, 確認user ID所在的頻道類別, 進行比對投放。
B聯播網, 會隨機記錄每個用戶的行為軌跡, 它不將行為軌跡的分為有限的類別, 也不把訂單分類別, 而是給予行為軌跡(造訪的頻道, 點擊的廣告, 使用的地區, 時間區段等) 一些標籤, 複選的標籤, 目的是要用更充分的描述, 來表示user的多元性和可能性。每次訂單進來, 訂單也給予多重的標籤; 每次用戶造訪某個頻道, 也對頻道給於多元的標籤,  在這些標籤中, 透過出現頻率和關聯性高低, 分析和預測user行為, 進而投放較類似的訂單。

以上的觀念很簡單, 但是我發現, 許多人不夠聰明, 或是過於拘泥在過去的CRM, data mining經驗, 而沒有弄懂。

1/01/2013

新年2013

迎接新年2013曙光, 陽光普照, 真令人高興
過去一年, 有許多新的發展, 未來一年, 更有許多挑戰, 為自己加油!