15 行為改變的基本原則
一九九○年代後期,一位名叫史蒂芬.盧比的公衛研究員離開位於內布拉斯加州奧馬哈市的家鄉,買了一張飛往巴基斯坦第一大城喀拉蚩的單程機票。
喀拉蚩是世界上人口數前段班的城市之一,到了一九九八年,已經有超過九百萬人以那裡為家。它是巴基斯坦的經濟中心與交通樞紐,有該地區最繁忙的機場與港口。在該城的商業區,你會找到標準的城市設施,以及車水馬龍的市中心街道;然而,喀拉蚩也是世界上最不宜人居的城市之一。
喀拉蚩有超過六成居民住在貧民窟與非法占用的聚落,這些人口稠密的區域滿是由舊木板、煤渣塊及其他廢棄物胡亂組成的臨時房屋,沒有處理垃圾的系統,沒有輸電網路,沒有乾淨的水。乾的時候,街道是塵土與垃圾的集合處;濕的時候,街道成了積滿汙水的泥坑。蚊子在一灘一灘的死水裡孳生,孩子在垃圾堆中嬉戲。
不衛生的條件導致疾病廣泛傳播。受汙染的水源造成腹瀉、嘔吐與腹痛的流行,而住在那裡的小孩,接近三分之一營養不良。這麼多人擠在這麼小的空間裡,病毒與細菌傳播的速度飛快。就是這樣的公衛災難,把史蒂芬.盧比帶到巴基斯坦。
盧比和他的團隊意識到,在一個衛生條件極差的環境裡,光是洗手這個簡單的習慣就能為居民的健康帶來很大的影響。但他們很快便發現,當地有許多人早就清楚洗手的重要性。
然而,即使知道,許多居民仍然用很隨便的方式洗手。有些人只是把手快速掠過水龍頭下方,碰個水而已,有些人只洗一隻手,而許多人在準備食物之前根本忘記洗手。每個人都說洗手很重要,但很少人養成洗手的習慣。問題不在於知不知道,而在於有沒有確實執行。
於是,盧比的團隊與寶僑公司合作,提供舒膚佳香皂給當地居民使用。比起一般肥皂,舒膚佳香皂用起來比較「享受」。
「在巴基斯坦,舒膚佳是頂級香皂。」盧比告訴我,「研究的參與者時常提到他們多麼喜歡這款香皂。」舒膚佳容易起泡,人們就可以在雙手塗滿肥皂泡沫,而且它聞起來很香。一夕之間,洗手變得比較令人愉悅了。
「我沒有把宣傳洗手這個目標看作行為的改變,而是看作習慣的採用。」盧比說,「比起採行一項不會提供令人愉悅的感官回饋的習慣,例如使用牙線,要人們採用可以提供強烈正面感官體驗的產品容易多了,例如薄荷口味的牙膏。寶僑的行銷團隊表示,目標是創造正面的洗手經驗。」
幾個月內,研究人員就發現該區域孩童的健康很快有了改變:腹瀉的發生率下降百分之五十二,肺炎的發生率下降百分之四十八,膿疱症(一種皮膚的細菌感染)發生率則下滑百分之三十五。
長期效應更佳。盧比告訴我:「我們在六年後回到喀拉蚩探訪,當初獲得免費香皂、被鼓勵洗手的家庭中,百分之九十五都有了放著肥皂的自來水洗手臺……這五年多來,我們沒有提供任何香皂給實驗組,但在之前的實驗中,他們已經很習慣洗手了,所以繼續維持下去。」這十分有力地證明了行為改變第四法則:讓獎賞令人滿足。
當體驗令人滿足,我們比較有可能重複某一行為。這全然合乎邏輯。愉悅的感受──就算只是用又香又容易起泡的肥皂洗手這種小愉悅──是給大腦的信號:「這感覺很好,下次還要再做。」愉悅感讓你的大腦知道某個行為值得記住與重複。
以口香糖的故事為例。整個十九世紀,口香糖都在做商業販售,但直到箭牌口香糖在一八九一年上市,嚼口香糖才成為風行全球的習慣。早期的口香糖是用相對無味的樹脂製成──有嚼勁,但不好吃。箭牌徹底革新這個產業,加入了白箭(綠薄荷)與黃箭(果汁)等口味,讓產品變得好吃且有趣。接著他們更進一步,開始把嚼口香糖塑造成一種清潔口腔的方式,廣告說口香糖會讓你「口氣清新」。
好吃的口味與清新口氣的感覺立即強化了這項產品,讓它用起來令人滿意。消費量飆升,箭牌也成了世界上最大的口香糖公司。
牙膏的發展軌跡也很類似。為產品增添綠薄荷、薄荷和肉桂等風味之後,生產商大為成功。這些味道其實沒有讓牙膏變得更有效,只是創造了「口腔清潔」的感覺,並且讓刷牙的經驗更令人覺得愉快。我老婆就因為不喜歡口中留下的味道而停止使用舒酸定牙膏,改用薄荷味較強的品牌,結果確實比較令她滿足。
反過來說,倘若一個經驗不令人滿足,我們就沒什麼理由重複。研究過程中,我遇到一個女人,她有個超自戀的親戚,總是令她抓狂。為了少花時間跟自大狂相處,每當這個親戚在場時,她都盡可能讓自己無聊乏味。見面幾回之後,這個親戚開始迴避她,因為覺得她太無趣了。
這些故事證明了行為改變的基本原則:帶來獎賞的行為會被重複,帶來懲罰的行為會被避免。根據過去得到獎賞(或懲罰)的經驗,我們學會未來怎麼做。正面情緒培養習慣,負面情緒摧毀習慣。
行為改變的前三條法則──讓提示顯而易見、讓習慣有吸引力、讓行動輕而易舉──增加了我們這一次執行某個行為的機率。行為改變的第四條法則──讓獎賞令人滿足──則增加我們下一次重複該行為的可能性。習慣迴路就這樣完成了。
但是,有個訣竅:不是任何一種滿足都好,我們追求的是立即的滿足。
立即獎賞與延遲獎賞之間的不一致
想像自己是漫步於非洲大草原上的動物──長頸鹿、大象或獅子──任何一個日子裡,你的決定大多會立刻產生影響。你一直想著要吃什麼,或者要在哪裡睡覺,或者如何躲避獵食者,總是把焦點放在當下或非常近的未來。你活在科學家所謂「立即回饋」的環境裡,因為你的行為會馬上帶來明確的結果。
現在,回到你的人類身分。生活在現代社會裡,你做的許多選擇都不會馬上帶來好處。在工作上表現優異,你會在幾週後收到薪水支票;今天運動,也許明年就不會過重;現在開始儲蓄,也許幾十年後就有足夠的錢享受退休生活。你活在科學家所謂「延遲回饋」的環境裡,因為可能要努力多年之後,你的行為才能帶來你想要的報償。
人類的大腦並沒有為延遲回饋的環境演化。二十萬年前的晚期智人是最早擁有相對類似現代人大腦的人類,尤其是新皮質──大腦最晚演化出來的部位,負責語言等高階功能──跟現代人的尺寸差不多,二十萬年來大致沒有改變。配備著舊石器時代硬體的我們,生活在現代社會。
直到近期──約莫最近五百年──以延遲回饋的環境為主的社會才成形1。比起大腦的年紀,現代社會還很新。最近一百年,我們見證了汽車、飛機、電視、個人電腦、網路、智慧型手機,以及碧昂絲的出現。這個世界在近幾年變動很大,人類的天性卻沒有太大的改變。
跟非洲大草原上的其他動物一樣,我們的祖先整天都在回應生死攸關的威脅,確保下一餐的食物,設法在風雨中找到遮蔽之處,因此,把立即的滿足看得很重也是理所當然,遙遠的未來比較不必顧慮。而生活在立即回饋的環境中幾千代之後,我們的大腦演化為喜歡快速報償勝過長遠報償。
行為經濟學家把這種傾向稱為「時間不一致性」:大腦對報償的評價隨著時間不同而不一致2。比起未來,你更看重當下。這種傾向通常對我們有益。當下確定有的獎賞,其價值通常比未來可能有的獎賞高。然而,我們對立即滿足的偏好有時會造成問題。
明知道抽菸會增加罹患肺癌的風險,為什麼有些人還是要抽?明知道過度飲食會增加肥胖的風險,為什麼有些人還是要大吃?明知道不安全的性行為可能會讓自己染上性病,為什麼有些人還是要這樣做?了解大腦如何決定獎賞的優先順序,答案就很明顯了:壞習慣的後果被延遲,其獎賞卻是立即的。吸菸可能會在十年後取你性命,但現在就可以為你降低壓力、解除菸癮;過度飲食長期來說有害,但當下可以滿足口腹之欲;性愛──安全或不安全的──立刻就能提供愉悅,疾病與感染則在幾天或幾週、甚至幾年後才會出現。
隨著時間過去,每個習慣都會帶來多重結果,不幸的是,這些結果往往不一致。壞習慣的立即結果讓人感覺很棒,終極結果卻會讓人感覺很糟;好習慣則是相反,立即的結果不怎麼讓人享受,最終結果卻會讓人感覺很好。法國經濟學家弗雷德里克.巴斯夏為這個問題提供了清楚的解釋:「當立即的結果讓人喜歡,後來的結果就會帶來災難,反之亦然──幾乎總是如此……一個習慣最初結的果實愈甜美,後來的果實往往愈苦澀。」
換言之,好習慣的代價在當下,壞習慣的代價在未來。
大腦對當下的偏好代表你不能仰賴良好的意圖。當你做了一個計畫──減重、寫書或學語言──其實是在為未來的自己制訂計畫。而當你設想理想的未來生活,就很容易看見可以帶來長遠利益的行動的價值,因為我們都想要讓未來的自己過更好的生活。然而,當抉擇的時刻到來,立即的滿足往往成為贏家。你不再為了夢想著身材更好、更有錢或更快樂的「未來的自己」做選擇,而是為了想有飽足感、想被縱容或想被娛樂的「現在的自己」抉擇。一般來說,一個行為讓你得到愈多立即的愉悅,你應該愈強烈地質疑該行為與自己的長遠目標是否一致3。
對大腦重複或避免某些行為的原因有了更全面的了解之後,我們來更新一下行為改變的基本原則:帶來立即獎賞的行為會被重複,帶來立即懲罰的行為會被避免。
人類對立即滿足的偏好揭露了一個關於成功的重要真相:由於大腦的設定,多數人會花費所有時間追求快速的滿足,比較少人選擇延遲滿足的路,所以如果你願意等候獎賞,就會遇到比較少的競爭,得到的報償也往往比較大。俗話說得好,最後一哩,最不擁擠。
研究正是如此顯示的。擅長延遲滿足的人學術水準測驗考試的成績較高,藥物濫用的機率較低,肥胖的可能性較低,對壓力的回應方式較好,社交技巧較優越。我們都在生活中看見種種例證:如果延遲看電視的時間,先把功課做好,你通常會學到更多東西,獲得更好的成績;假如在商店不買甜點和洋芋片,回到家之後往往會吃比較健康的食物。在某個時間點,幾乎每個領域的成功都需要你為了未來的報償而忽視立即的獎賞。
問題來了:大多數人都知道延遲滿足是有智慧的做法,他們想要好習慣帶來的健康、有生產力、心靈平靜等益處,但在做決定的時刻,這些成果很少會被放在第一優先。幸好,訓練自己延遲滿足是有可能的──但必須順著人性的常理去做,不能逆著。最好的辦法就是為長遠有益的習慣添加一些立即的愉悅,為長遠無益的習慣增添一些立即的痛苦。
如何把「立即滿足」變得對你有利
維持一項習慣的關鍵重點是「成功」的感受,就算只是小規模。成功的感受讓你知道該習慣有所回報,努力是值得的。
理想情況下,好習慣的獎賞就是那個習慣本身;但真實狀況是,除非好習慣提供你一些什麼,不然你往往感覺不出它是值得的。初期全是犧牲,上了健身房幾次,卻沒有變壯、變瘦或變快──至少察覺不出來;直到幾個月後,當你減掉幾磅,或是手臂的線條開始出現,為了運動而運動才會變得比較容易。一開始,你需要一個維持正軌的理由,這就是為什麼立即的獎賞不可或缺。當延遲的獎賞在不引人注目的地方累積時,這些立即的獎賞可以助你保持亢奮。
討論立即的獎賞時,我們所說的其實是一項行為的結尾。任何經驗的結尾都很重要,因為比起其他階段,我們往往把結尾記得最清楚。所以,必須讓習慣的結尾令人滿足。最好的方法是強化,也就是運用立即的獎賞提高一項行為被執行的機率。第五章提到的習慣堆疊是將習慣與立即的提示連結在一起,讓開始執行的時機顯而易見;強化法則把習慣跟立即的獎賞綁在一起,讓你在結束時感到滿足。
處理想要避免的習慣──也就是想要停止的行為──時,立即的強化尤其有用。堅守「不要隨便花錢」或「一個月滴酒不沾」這類習慣可能頗具挑戰性,因為當你略過酒吧的減價時段或不買某雙鞋子時,什麼事情都沒發生。本來就沒有行動時,很難讓人感到滿足。你所做的只是抵抗誘惑,這沒什麼好令人滿足的。
一個解決方法是把情況顛倒:讓避免變得可見。開一個存款帳戶,並以自己想要的某樣事物命名(也許是「皮外套」),然後每跳過一樣東西不買,就在那個帳戶裡存進同等金額的錢。早餐沒點拿鐵?轉五美元進去;下個月不訂購 Netflix?轉十美元進去。這就像是為自己創造一個紅利積點方案。看見自己因為存錢而離皮外套更進一步,這種立即的獎賞會讓你感覺良好,而不是覺得被剝奪。你讓無所作為變得令人滿足。
我的一個讀者和他的妻子採用了相似的策略。他們想要盡量不外食,多在家裡煮東西吃,於是開了一個名為「歐洲之旅」的帳戶,每跳過一頓外食,就轉五十美元進去;到了年底,他們就把存下來的錢拿來度假。
值得注意的是,選擇的短期獎賞必須能夠強化你的身分認同,不能與之牴觸。如果你想要減重或閱讀更多書,買一件皮外套沒問題;但如果你的目標是減少開支與存錢,這個獎賞就行不通了。你可以選擇以泡泡浴或優閒散步來犒賞自己作為替代,這樣就與你想要更多自由與財務獨立的終極目標一致了。同理,若是你用吃冰淇淋來獎勵運動完的自己,等於投票給相牴觸的身分認同,到頭來只是正負相抵而已;反之,你可以選擇用按摩當作獎賞,既享受又符合照顧身體的目標,這樣一來,短期獎賞就與成為一個健康的人的長期願景一致了。
最後,當較好的心情、較多的能量與較低的壓力等內在獎賞登場,你就比較不會忙於追求次要獎賞了。身分認同本身成了強化物,你會這麼做,是因為你就是這種人,做自己感覺很好。習慣愈是成為你生活的一部分,你愈不需要外在的鼓勵來協助你貫徹。動機讓你開啟習慣,身分認同讓你維持習慣。
不過,證據的累積與新身分認同的出現都需要時間。在等待長期獎賞出現時,立即的強化能幫助你在短期內保持動機。
總而言之,一項習慣必須讓人覺得愉快,才能持續下去。一點簡單的強化──例如好聞的香皂、有清新薄荷味的牙膏,或是看見帳戶裡多了五十美元──能夠提供所需的立即愉悅感,讓你享受一項習慣。而當改變令你覺得愉快、享受時,想要改變就很容易了。
本章總覽
行為改變第四法則,是「讓獎賞令人滿足」。
當經驗令人滿足,我們比較有可能重複一項行為。
人類的大腦演化為優先考慮立即的獎賞,而不是延遲的獎賞。
行為改變的基本原則:帶來立即獎賞的行為會被重複,帶來立即懲罰的行為會被避免。
維持一項習慣的關鍵重點是「成功」的感受──就算只是小規模。
行為改變的前三條法則──讓提示顯而易見、讓習慣有吸引力、讓行動輕而易舉──增加了我們這一次執行某個行為的機率。行為改變的第四條法則──讓獎賞令人滿足──則增加我們下一次重複該行為的可能性。
1 一萬年前農業出現,農夫開始種植作物,期待數月後的收成,可能從此讓人類踏入延遲回饋的環境。然而,直到最近幾世紀,我們的生活才充滿延遲回饋的選擇:生涯規畫、退休規畫、度假規畫,以及占據我們行事曆的種種計畫。
2 時間不一致性也被稱為「雙曲貼現」。
3 這也會讓我們的決策脫軌。大腦會高估任何看似立即的威脅,但幾乎不可能發生的事,例如小亂流導致墜機、獨自在家時竊賊入侵、搭乘的公車被恐怖分子炸毀;同時,大腦會低估看似遙遠,但其實很有可能發生的威脅,例如吃垃圾食物穩定累積的脂肪、久坐辦公室逐漸導致的肌肉萎縮、不整理慢慢造成的雜物囤積。