聯合航空強拉旅客事件反思資料科學道德問題

這幾天最熱門的新聞莫過於聯合航空因超賣機票導致機位不足,而後強行拖行亞裔旅客下機的事件。在一次次看到社群網路、新聞播送令人義憤填膺的影片的同時,我腦海中第一個浮現的問題是:

為什麼航空公司會超賣機位?

避險的商業遊戲

在一連串的資料搜集與理解後,才知道一切其實是出於航空公司的“收益管理”。一直以來,不僅僅是航空公司,只要牽涉到提供預售、預定的產業,例如餐廳、旅館等,最大的麻煩不是顧客取消預定,而是“no show",對於這些企業而言,no show除了預期的收益消失之外,還要犧牲獲利的機會,只為了這些“no show"的顧客。而航空公司一次的飛行因為成本極大,因此有了一套配套措施,也就是先預估好某個比例的顧客會no show或退票,之後超賣這些比例的機票,當乘客真的沒有出現的時候,還有超賣的名單可以降低損失,甚至多收到一筆退票費。但這個聰明的辦法總有失敗的時候,尤其在旅遊旺季,常常就必須負擔超賣的數量錯估,導致機位供不應求的狀況發生。

但既然木已成舟,就需要徵求一些放棄機位的乘客解決問題。這時航空公司秉持著重賞之下必有勇夫的策略,用各種的補償方式來徵求自願者。若自願放棄機位的旅客能剛好補足超賣的機位,那倒也相安無事。那如果沒有乘客願意放棄或是願意放棄的乘客數量不足以彌補超賣的機位時,又該如何是好?這是我在了解什麼是超賣機位後的第二個問題。

隨機騙局

答案是『隨機』。一般來說乘客能得到的回覆,基本上都是航空公司宣稱會隨機挑選乘客,並用補償的方式希望乘客能放棄機位。有接觸過一點數學領域的朋友們一定知道隨機是個讓人又愛又恨的詞。當我看到隨機這個詞的時候,直覺的反射就是:要如何隨機?真的是隨機挑選嗎?仔細探究背後運作機制,其實是航空公司自有一套優先順序的挑選機制,理所當然的,頭等艙、商務艙、VIP會員等是最先被排除的族群,而最容易被挑選的族群就是那些單獨搭機、第一次搭乘的旅客。而隨機,只是一個和乘客解釋的表象說法。

機率:它是指接受我們的知識缺乏確定性,並且發展各種方法以處理我們的無知。

-《隨機騙局Fooled by Randomness》Nassim Nicolas Taleb

我相信航空公司自有一套標準計算方式統計這些超賣機位時遇到no show與真的超賣的期望值,以及最大化收益的一套算法,也許,某些航空公司甚至利用資料科學的一些演算機制來預測接受放棄機位機率最高的乘客特徵,或是預測哪些特徵的乘客會在下一班班機no show等。但當我們擁有這些訊息將數據徹底運用的同時,資料科學家們,會不會同時深陷道德爭議中?

資料的道德

前陣子人工智慧領域所討論的道德話題,大致是關於機器學習的結果如果牽涉到結果的嚴重性與人類的道德議題,該如何解決。例如智慧駕駛車如果即將遇到車禍撞到3個小朋友,經人工智慧判斷的結果有二:撞上去,能確保乘客安全但孩童將嚴重受傷,閃過去,乘客將因閃避而撞上一旁的分隔島受重傷。但這次聯合航空的事件,讓我認為除了預測事件的結果會有所爭議須謹慎處理之外,資料本身或是預測的方式,都可能是影響資料道德的關鍵因子。

當我們分析的同時,可能某些欄位是呈現每位旅客的國籍、種族、膚色,而當我們將這些資料欄位用以預測時,其實無形中是容易無意間增加種族對立的。以這次的例子而言,我們可能分析出的結果是:20~30歲自助旅遊的黃種人接受放棄機位的機率最高,因而產生相對應的措施,但我認為這樣的方式雖然能最大化資料預測的效益,卻會對於化解社會歧見帶來負面的效果。畢竟,我們不該將種族,視為理所當然的界線劃分。

資料科學家若為了訓練結果而給定一些特徵"label",會不會也有意無意間也將“貼標籤”的歧見加諸在無辜的大眾。愛因斯坦因為相對論,直接間接的導致原子彈的發明,出乎預料的結果導致一發不可收拾的發展,使得愛因斯坦的後半生內疚不安。

而後世的我們,雖離愛因斯坦的影響力差之千里,卻不能不以此自我警惕。避免站在世代發展浪頭上的我們,失去價值觀的最後一道防線。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s

Create a website or blog at WordPress.com

向上 ↑

%d 位部落客按了讚: