15 行為改變的基本原則

15　行為改變的基本原則

　　一九九○年代後期，一位名叫史蒂芬．盧比的公衛研究員離開位於內布拉斯加州奧馬哈市的家鄉，買了一張飛往巴基斯坦第一大城喀拉蚩的單程機票。

　　喀拉蚩是世界上人口數前段班的城市之一，到了一九九八年，已經有超過九百萬人以那裡為家。它是巴基斯坦的經濟中心與交通樞紐，有該地區最繁忙的機場與港口。在該城的商業區，你會找到標準的城市設施，以及車水馬龍的市中心街道；然而，喀拉蚩也是世界上最不宜人居的城市之一。

　　喀拉蚩有超過六成居民住在貧民窟與非法占用的聚落，這些人口稠密的區域滿是由舊木板、煤渣塊及其他廢棄物胡亂組成的臨時房屋，沒有處理垃圾的系統，沒有輸電網路，沒有乾淨的水。乾的時候，街道是塵土與垃圾的集合處；濕的時候，街道成了積滿汙水的泥坑。蚊子在一灘一灘的死水裡孳生，孩子在垃圾堆中嬉戲。

　　不衛生的條件導致疾病廣泛傳播。受汙染的水源造成腹瀉、嘔吐與腹痛的流行，而住在那裡的小孩，接近三分之一營養不良。這麼多人擠在這麼小的空間裡，病毒與細菌傳播的速度飛快。就是這樣的公衛災難，把史蒂芬．盧比帶到巴基斯坦。

　　盧比和他的團隊意識到，在一個衛生條件極差的環境裡，光是洗手這個簡單的習慣就能為居民的健康帶來很大的影響。但他們很快便發現，當地有許多人早就清楚洗手的重要性。

　　然而，即使知道，許多居民仍然用很隨便的方式洗手。有些人只是把手快速掠過水龍頭下方，碰個水而已，有些人只洗一隻手，而許多人在準備食物之前根本忘記洗手。每個人都說洗手很重要，但很少人養成洗手的習慣。問題不在於知不知道，而在於有沒有確實執行。

　　於是，盧比的團隊與寶僑公司合作，提供舒膚佳香皂給當地居民使用。比起一般肥皂，舒膚佳香皂用起來比較「享受」。

　　「在巴基斯坦，舒膚佳是頂級香皂。」盧比告訴我，「研究的參與者時常提到他們多麼喜歡這款香皂。」舒膚佳容易起泡，人們就可以在雙手塗滿肥皂泡沫，而且它聞起來很香。一夕之間，洗手變得比較令人愉悅了。

　　「我沒有把宣傳洗手這個目標看作行為的改變，而是看作習慣的採用。」盧比說，「比起採行一項不會提供令人愉悅的感官回饋的習慣，例如使用牙線，要人們採用可以提供強烈正面感官體驗的產品容易多了，例如薄荷口味的牙膏。寶僑的行銷團隊表示，目標是創造正面的洗手經驗。」

　　幾個月內，研究人員就發現該區域孩童的健康很快有了改變：腹瀉的發生率下降百分之五十二，肺炎的發生率下降百分之四十八，膿疱症（一種皮膚的細菌感染）發生率則下滑百分之三十五。

　　長期效應更佳。盧比告訴我：「我們在六年後回到喀拉蚩探訪，當初獲得免費香皂、被鼓勵洗手的家庭中，百分之九十五都有了放著肥皂的自來水洗手臺……這五年多來，我們沒有提供任何香皂給實驗組，但在之前的實驗中，他們已經很習慣洗手了，所以繼續維持下去。」這十分有力地證明了行為改變第四法則：讓獎賞令人滿足。

　　當體驗令人滿足，我們比較有可能重複某一行為。這全然合乎邏輯。愉悅的感受──就算只是用又香又容易起泡的肥皂洗手這種小愉悅──是給大腦的信號：「這感覺很好，下次還要再做。」愉悅感讓你的大腦知道某個行為值得記住與重複。

　　以口香糖的故事為例。整個十九世紀，口香糖都在做商業販售，但直到箭牌口香糖在一八九一年上市，嚼口香糖才成為風行全球的習慣。早期的口香糖是用相對無味的樹脂製成──有嚼勁，但不好吃。箭牌徹底革新這個產業，加入了白箭（綠薄荷）與黃箭（果汁）等口味，讓產品變得好吃且有趣。接著他們更進一步，開始把嚼口香糖塑造成一種清潔口腔的方式，廣告說口香糖會讓你「口氣清新」。

　　好吃的口味與清新口氣的感覺立即強化了這項產品，讓它用起來令人滿意。消費量飆升，箭牌也成了世界上最大的口香糖公司。

　　牙膏的發展軌跡也很類似。為產品增添綠薄荷、薄荷和肉桂等風味之後，生產商大為成功。這些味道其實沒有讓牙膏變得更有效，只是創造了「口腔清潔」的感覺，並且讓刷牙的經驗更令人覺得愉快。我老婆就因為不喜歡口中留下的味道而停止使用舒酸定牙膏，改用薄荷味較強的品牌，結果確實比較令她滿足。

　　反過來說，倘若一個經驗不令人滿足，我們就沒什麼理由重複。研究過程中，我遇到一個女人，她有個超自戀的親戚，總是令她抓狂。為了少花時間跟自大狂相處，每當這個親戚在場時，她都盡可能讓自己無聊乏味。見面幾回之後，這個親戚開始迴避她，因為覺得她太無趣了。

　　這些故事證明了行為改變的基本原則：帶來獎賞的行為會被重複，帶來懲罰的行為會被避免。根據過去得到獎賞（或懲罰）的經驗，我們學會未來怎麼做。正面情緒培養習慣，負面情緒摧毀習慣。

　　行為改變的前三條法則──讓提示顯而易見、讓習慣有吸引力、讓行動輕而易舉──增加了我們這一次執行某個行為的機率。行為改變的第四條法則──讓獎賞令人滿足──則增加我們下一次重複該行為的可能性。習慣迴路就這樣完成了。

　　但是，有個訣竅：不是任何一種滿足都好，我們追求的是立即的滿足。

立即獎賞與延遲獎賞之間的不一致

　　想像自己是漫步於非洲大草原上的動物──長頸鹿、大象或獅子──任何一個日子裡，你的決定大多會立刻產生影響。你一直想著要吃什麼，或者要在哪裡睡覺，或者如何躲避獵食者，總是把焦點放在當下或非常近的未來。你活在科學家所謂「立即回饋」的環境裡，因為你的行為會馬上帶來明確的結果。

　　現在，回到你的人類身分。生活在現代社會裡，你做的許多選擇都不會馬上帶來好處。在工作上表現優異，你會在幾週後收到薪水支票；今天運動，也許明年就不會過重；現在開始儲蓄，也許幾十年後就有足夠的錢享受退休生活。你活在科學家所謂「延遲回饋」的環境裡，因為可能要努力多年之後，你的行為才能帶來你想要的報償。

　　人類的大腦並沒有為延遲回饋的環境演化。二十萬年前的晚期智人是最早擁有相對類似現代人大腦的人類，尤其是新皮質──大腦最晚演化出來的部位，負責語言等高階功能──跟現代人的尺寸差不多，二十萬年來大致沒有改變。配備著舊石器時代硬體的我們，生活在現代社會。

　　直到近期──約莫最近五百年──以延遲回饋的環境為主的社會才成形1。比起大腦的年紀，現代社會還很新。最近一百年，我們見證了汽車、飛機、電視、個人電腦、網路、智慧型手機，以及碧昂絲的出現。這個世界在近幾年變動很大，人類的天性卻沒有太大的改變。

　　跟非洲大草原上的其他動物一樣，我們的祖先整天都在回應生死攸關的威脅，確保下一餐的食物，設法在風雨中找到遮蔽之處，因此，把立即的滿足看得很重也是理所當然，遙遠的未來比較不必顧慮。而生活在立即回饋的環境中幾千代之後，我們的大腦演化為喜歡快速報償勝過長遠報償。

　　行為經濟學家把這種傾向稱為「時間不一致性」：大腦對報償的評價隨著時間不同而不一致2。比起未來，你更看重當下。這種傾向通常對我們有益。當下確定有的獎賞，其價值通常比未來可能有的獎賞高。然而，我們對立即滿足的偏好有時會造成問題。

　　明知道抽菸會增加罹患肺癌的風險，為什麼有些人還是要抽？明知道過度飲食會增加肥胖的風險，為什麼有些人還是要大吃？明知道不安全的性行為可能會讓自己染上性病，為什麼有些人還是要這樣做？了解大腦如何決定獎賞的優先順序，答案就很明顯了：壞習慣的後果被延遲，其獎賞卻是立即的。吸菸可能會在十年後取你性命，但現在就可以為你降低壓力、解除菸癮；過度飲食長期來說有害，但當下可以滿足口腹之欲；性愛──安全或不安全的──立刻就能提供愉悅，疾病與感染則在幾天或幾週、甚至幾年後才會出現。

　　隨著時間過去，每個習慣都會帶來多重結果，不幸的是，這些結果往往不一致。壞習慣的立即結果讓人感覺很棒，終極結果卻會讓人感覺很糟；好習慣則是相反，立即的結果不怎麼讓人享受，最終結果卻會讓人感覺很好。法國經濟學家弗雷德里克．巴斯夏為這個問題提供了清楚的解釋：「當立即的結果讓人喜歡，後來的結果就會帶來災難，反之亦然──幾乎總是如此……一個習慣最初結的果實愈甜美，後來的果實往往愈苦澀。」

　　換言之，好習慣的代價在當下，壞習慣的代價在未來。

　　大腦對當下的偏好代表你不能仰賴良好的意圖。當你做了一個計畫──減重、寫書或學語言──其實是在為未來的自己制訂計畫。而當你設想理想的未來生活，就很容易看見可以帶來長遠利益的行動的價值，因為我們都想要讓未來的自己過更好的生活。然而，當抉擇的時刻到來，立即的滿足往往成為贏家。你不再為了夢想著身材更好、更有錢或更快樂的「未來的自己」做選擇，而是為了想有飽足感、想被縱容或想被娛樂的「現在的自己」抉擇。一般來說，一個行為讓你得到愈多立即的愉悅，你應該愈強烈地質疑該行為與自己的長遠目標是否一致3。

　　對大腦重複或避免某些行為的原因有了更全面的了解之後，我們來更新一下行為改變的基本原則：帶來立即獎賞的行為會被重複，帶來立即懲罰的行為會被避免。

　　人類對立即滿足的偏好揭露了一個關於成功的重要真相：由於大腦的設定，多數人會花費所有時間追求快速的滿足，比較少人選擇延遲滿足的路，所以如果你願意等候獎賞，就會遇到比較少的競爭，得到的報償也往往比較大。俗話說得好，最後一哩，最不擁擠。

　　研究正是如此顯示的。擅長延遲滿足的人學術水準測驗考試的成績較高，藥物濫用的機率較低，肥胖的可能性較低，對壓力的回應方式較好，社交技巧較優越。我們都在生活中看見種種例證：如果延遲看電視的時間，先把功課做好，你通常會學到更多東西，獲得更好的成績；假如在商店不買甜點和洋芋片，回到家之後往往會吃比較健康的食物。在某個時間點，幾乎每個領域的成功都需要你為了未來的報償而忽視立即的獎賞。

　　問題來了：大多數人都知道延遲滿足是有智慧的做法，他們想要好習慣帶來的健康、有生產力、心靈平靜等益處，但在做決定的時刻，這些成果很少會被放在第一優先。幸好，訓練自己延遲滿足是有可能的──但必須順著人性的常理去做，不能逆著。最好的辦法就是為長遠有益的習慣添加一些立即的愉悅，為長遠無益的習慣增添一些立即的痛苦。

如何把「立即滿足」變得對你有利

　　維持一項習慣的關鍵重點是「成功」的感受，就算只是小規模。成功的感受讓你知道該習慣有所回報，努力是值得的。

　　理想情況下，好習慣的獎賞就是那個習慣本身；但真實狀況是，除非好習慣提供你一些什麼，不然你往往感覺不出它是值得的。初期全是犧牲，上了健身房幾次，卻沒有變壯、變瘦或變快──至少察覺不出來；直到幾個月後，當你減掉幾磅，或是手臂的線條開始出現，為了運動而運動才會變得比較容易。一開始，你需要一個維持正軌的理由，這就是為什麼立即的獎賞不可或缺。當延遲的獎賞在不引人注目的地方累積時，這些立即的獎賞可以助你保持亢奮。

　　討論立即的獎賞時，我們所說的其實是一項行為的結尾。任何經驗的結尾都很重要，因為比起其他階段，我們往往把結尾記得最清楚。所以，必須讓習慣的結尾令人滿足。最好的方法是強化，也就是運用立即的獎賞提高一項行為被執行的機率。第五章提到的習慣堆疊是將習慣與立即的提示連結在一起，讓開始執行的時機顯而易見；強化法則把習慣跟立即的獎賞綁在一起，讓你在結束時感到滿足。

　　處理想要避免的習慣──也就是想要停止的行為──時，立即的強化尤其有用。堅守「不要隨便花錢」或「一個月滴酒不沾」這類習慣可能頗具挑戰性，因為當你略過酒吧的減價時段或不買某雙鞋子時，什麼事情都沒發生。本來就沒有行動時，很難讓人感到滿足。你所做的只是抵抗誘惑，這沒什麼好令人滿足的。

　　一個解決方法是把情況顛倒：讓避免變得可見。開一個存款帳戶，並以自己想要的某樣事物命名（也許是「皮外套」），然後每跳過一樣東西不買，就在那個帳戶裡存進同等金額的錢。早餐沒點拿鐵？轉五美元進去；下個月不訂購 Netflix？轉十美元進去。這就像是為自己創造一個紅利積點方案。看見自己因為存錢而離皮外套更進一步，這種立即的獎賞會讓你感覺良好，而不是覺得被剝奪。你讓無所作為變得令人滿足。

　　我的一個讀者和他的妻子採用了相似的策略。他們想要盡量不外食，多在家裡煮東西吃，於是開了一個名為「歐洲之旅」的帳戶，每跳過一頓外食，就轉五十美元進去；到了年底，他們就把存下來的錢拿來度假。

　　值得注意的是，選擇的短期獎賞必須能夠強化你的身分認同，不能與之牴觸。如果你想要減重或閱讀更多書，買一件皮外套沒問題；但如果你的目標是減少開支與存錢，這個獎賞就行不通了。你可以選擇以泡泡浴或優閒散步來犒賞自己作為替代，這樣就與你想要更多自由與財務獨立的終極目標一致了。同理，若是你用吃冰淇淋來獎勵運動完的自己，等於投票給相牴觸的身分認同，到頭來只是正負相抵而已；反之，你可以選擇用按摩當作獎賞，既享受又符合照顧身體的目標，這樣一來，短期獎賞就與成為一個健康的人的長期願景一致了。

　　最後，當較好的心情、較多的能量與較低的壓力等內在獎賞登場，你就比較不會忙於追求次要獎賞了。身分認同本身成了強化物，你會這麼做，是因為你就是這種人，做自己感覺很好。習慣愈是成為你生活的一部分，你愈不需要外在的鼓勵來協助你貫徹。動機讓你開啟習慣，身分認同讓你維持習慣。

　　不過，證據的累積與新身分認同的出現都需要時間。在等待長期獎賞出現時，立即的強化能幫助你在短期內保持動機。

　　總而言之，一項習慣必須讓人覺得愉快，才能持續下去。一點簡單的強化──例如好聞的香皂、有清新薄荷味的牙膏，或是看見帳戶裡多了五十美元──能夠提供所需的立即愉悅感，讓你享受一項習慣。而當改變令你覺得愉快、享受時，想要改變就很容易了。

本章總覽

行為改變第四法則，是「讓獎賞令人滿足」。

當經驗令人滿足，我們比較有可能重複一項行為。

人類的大腦演化為優先考慮立即的獎賞，而不是延遲的獎賞。

行為改變的基本原則：帶來立即獎賞的行為會被重複，帶來立即懲罰的行為會被避免。

維持一項習慣的關鍵重點是「成功」的感受──就算只是小規模。

行為改變的前三條法則──讓提示顯而易見、讓習慣有吸引力、讓行動輕而易舉──增加了我們這一次執行某個行為的機率。行為改變的第四條法則──讓獎賞令人滿足──則增加我們下一次重複該行為的可能性。

　　1 一萬年前農業出現，農夫開始種植作物，期待數月後的收成，可能從此讓人類踏入延遲回饋的環境。然而，直到最近幾世紀，我們的生活才充滿延遲回饋的選擇：生涯規畫、退休規畫、度假規畫，以及占據我們行事曆的種種計畫。

　　2 時間不一致性也被稱為「雙曲貼現」。

　　3 這也會讓我們的決策脫軌。大腦會高估任何看似立即的威脅，但幾乎不可能發生的事，例如小亂流導致墜機、獨自在家時竊賊入侵、搭乘的公車被恐怖分子炸毀；同時，大腦會低估看似遙遠，但其實很有可能發生的威脅，例如吃垃圾食物穩定累積的脂肪、久坐辦公室逐漸導致的肌肉萎縮、不整理慢慢造成的雜物囤積。