rubi_mos2002
New member
- Xu
- 0
Skinner không phải là nhà tâm lý học đầu tiên nghiên cứu về ảnh hưởng của phần thưởng lên hành vi. Nhưng nghiên cứu của ông đã lát đường cho nhiều thập kỷ của những nghiên cứu theo sau về những cách mà con người và động vật có thể được huấn luyện hiệu quả nhất để học hỏi.
Một trong những cống hiến chính của Skinner là nhấn mạnh giá trị của sự củng cố tích cực. Skinner chỉ ra rằng nếu bạn muốn một ai đó thay đổi, tốt hơn là bạn nên sử dụng củ cà rốt hơn là cây gậy. Trừng phạt con người vì có hành vi xấu ít có khả năng khiến họ thay đổi so với cho họ sự động viên để làm những việc bạn muốn họ làm. Trong thực tế, trừng phạt có thể gây phản tác dụng với ý định của bạn, làm họ trở nên tức giận hoặc sợ hãi.
Bây giờ hãy nói về cách làm thế nào để thúc đẩy bản thân bạn. Chúng ta vừa thấy trừng phạt người khác không phải là chiến lược tốt nhất để làm họ thay đổi hành vi của họ, và điều đó cũng đúng khi nói đến việc thay đổi hành vi của riêng bạn. Bạn dễ dàng chì chiết, trừng phạt bản thân vì không đạt được những mục tiêu của bạn, nhưng kết quả cuối cùng sẽ chỉ khiến bạn trở nên nhụt chí, chán nản hơn bao giờ hết.
Bước đầu tiên trong việc sử dụng củng cố để thúc đẩy bản thân là xác định những phần thưởng sẽ có hiệu quả để giúp bạn thay đổi. Bạn thực sự yêu thích những hoạt động gì? Bạn đặc biệt giỏi về lĩnh vực gì? Nếu bạn có thể liệt kê 4 hoặc 5 phần thưởng mà bạn biết bạn sẽ nỗ lực để đạt được chúng thì bạn có thể thúc đẩy bản thân hành động. Có thể hành vi bạn thấy là đem lại phần thưởng lớn nhất cũng chính là hành vi bạn đang cố gắng thay đổi (như hút thuốc, ăn quá nhiều, không tập thể dục, chơi game). Điều này ok. Chừng nào bạn gắn liền một phần thưởng với một sự thay đổi trong hành vi (hút thuốc ít đi, ăn ít, tập thể dục nhiều hơn, dành ít thời gian hơn cho game), thì bạn có thể vẫn thu được hiệu quả với phần thưởng này. Nhưng có lẽ bạn nên chọn một hành vi (được xem là một phần thưởng) khác với hành vi bạn đang cố gắng thay đổi.
Thứ hai, xác định những phần thưởng nào đang duy trì hành vi của bạn hiện tại. (Ý là một hành vi dù xấu nhưng nó phải có lợi cho bạn thì nó mới tiếp tục tồn tại. Cái lợi đó chính là phần thưởng). Điều gì ở game online khiến bạn tiếp tục muốn chơi nhiều hơn? Tại sao bạn đánh bạc quá nhiều ngay cả khi bạn liên tục thua? Điều gì quyến rũ đằng sau việc đi mua sắm bốc đồng của bạn? Skinner khám phá ra rằng hành vi của chúng ta được duy trì ở những mức độ khác nhau phụ thuộc vào kiểu củng cố. Những con vật trong “cái hộp Skinner” của Skinner cho thấy những kiểu phản ứng khác nhau dựa trên khi nào và trong những tình huống nào chúng nhận được phần thưởng. Dù có nhiều khả năng thu được một hành vi khi nó được thưởng mỗi lần hành vi xuất hiện, một khi hành vi được thiết lập thì những chú bồ câu sẽ mổ nhiều hơn để có một dĩa thức ăn nếu phần thưởng đó chỉ thỉnh thoảng mới xuất hiện. Những kiểu “lúc có lúc không” đó của sự củng cố khiến những chú bồ không trở nên lười biếng và tự bằng lòng. Còn với kiểu liên tục, vì chúng có được phần thưởng mỗi lần chúng mổ một cái đòn bẩy nên chúng chỉ mổ khi chúng thực sự cần phần thưởng. Còn với kiểu “lúc có lúc không” thì phần thưởng trở nên ít dự đoán được hoặc ít ra là không dễ đạt được.
Có 2 mặt với những kiểu củng cố. Thứ nhất là kiểu củng cố: cố định hay thay đổi. Thứ hai là nền tảng cho sự củng cố. Nó có 2 loại: Củng cố dựa trên thời gian: bạn sẽ có được phần thưởng nếu bạn thực hiện hành vi được mong muốn tại bất kỳ thời điểm nào trong khoảng thời gian nào đó; củng cố dựa trên phản ứng: bạn nhận được phần thưởng cho mỗi x lần phản ứng đúng bạn thực hiện.
Đặt tất cả các kiểu củng cố với nền tảng củng cố, bạn sẽ có 4 kiểu củng cố:
Thời gian cố định: Một phần thưởng xuất hiện nếu hành vi được mong muốn xuất hiện vảo một thời điểm cụ thể. Ví dụ “Giảm giá vào Thứ ba”, khi đó khách hàng sẽ được giảm một khoản tiền nhất định vào ngày cụ thể đó. Nếu bạn biết mình sẽ được giảm giá thì bạn sẽ mua món hàng nào đó vào thứ ba hơn là thứ hai.
Thay đổi thời gian: Một phần thưởng xuất hiện nếu hành vi được mong đợi xuất hiện, trong suốt một khoảng thời gian nào đó. Đây là một chiêu khuyến mãi phổ biến được sử dụng ở những nhà ga thông báo bạn sẽ giành được một phần thưởng nếu bạn là người gọi thứ 10, ví dụ ở một thời điểm như từ 9-10h. Cơ hội phần thưởng có thể được trao cho lúc 9:05, 9:25, hoặc 9:58.
Phản ứng cố định: Bạn có được một phần thưởng cho mỗi x lần phản ứng bạn thực hiện. Một quán café khuyễn mãi thêm 1 cốc café miễn phí sau khi bạn mua đủ 10 cốc.
Phản ứng thay đổi: Bạn có được một phần thưởng cho đáp ứng, theo trung bình, mỗi “xth” lần. Ví dụ, một game online tặng thêm tiền cho bạn khi bạn chơi đến trò thứ 25. Hoặc bạn gái của bạn sẽ cười trước câu chuyện đùa của bạn chỉ đến khi bạn kể đến câu chuyện thứ 5. Bạn biết bạn sẽ có được một nụ cười, nhưng bạn không thể đoán được khi nào cô ấy sẽ thưởng cho bạn.
Nếu bạn đang bị dính mắc vào một thứ gì đấy thì khả năng là nó đem lại sự củng cố “phản ứng thay đổi”. Bạn không bao giờ biết khi nào bạn sẽ được thưởng, dù bạn biết qua kinh nghiệm rằng phần thưởng sẽ đến vào một thời điểm nào đó. Do đó, bạn tiếp tục thực hiện hành vi với một mức độ cao và đều đều. Vì bạn có thể không biết chính xác bạn đang ở đâu trong chuỗi củng cố (trò chơi thứ 1 hay thứ 25 sẽ đem lại phần thưởng), kiểu củng cố này tạo ra hành vi chống lại sự dập tắt cao. Tất cả những gì nó cần là một phần thưởng và bạn sẽ tiếp tục thực hiện hành vi.
Kiểu củng cố “phản ứng cố định” cũng có xu hướng đem lại tỷ lệ phản ứng cao vì phần thưởng nằm trong sự kiểm soát của bạn. Tuy nhiên, vì bạn biết khả năng nhận được phần thưởng nên bạn có thể dừng thực hiện hành vi và nghỉ ngơi sau khi thực hiện nó.
Kiểu củng cố “thay đổi thời gian” có thể khiến bạn phản ứng thường xuyên, nhưng vì thời gian không nằm dưới sự kiểm soát của bạn, nếu khoảng thời gian đủ dài thì bạn sẽ nghĩ ngơi cho đến khi phần thưởng tiếp theo sẵn sàng.
Bạn sẽ phản ứng ít thường xuyên nhất nếu hành vi của bạn được duy trì bởi kiểu củng cố “thời gian cố định.”
Những ví dụ hằng ngày cho thấy chúng ta điều chỉnh hành vi của chúng ta như thế nào trước kiểu củng cố được quy định bởi những nhà quảng cáo, sếp, người yêu hoặc thậm chí bản thân chúng ta.
Hãy xem thử kiểu củng cố nào có lợi cho bạn. Nếu bạn biết rằng bạn sẽ phản ứng thường xuyên nhất và lâu nhất trước kiểu củng cố “phản ứng thay đổi” thì điều này có thể giúp bạn giải thích một số hành vi mang tính nghiện ngập và cưỡng bách của bạn. Còn nếu bạn không được thúc đẩy đủ để thực hiện một hành vi? Đó có phải vì kiểu củng cố “thời gian cố định”?
Như vậy, với kiến thức về kiểu củng cố, bạn có thể hiểu hành vi của bạn có thể bị kiểm soát như thế nào bởi những tác động mà bạn không nhận ra. Chỉ có một điểm giúp bạn sử dụng củng cố để có lợi cho bạn. Đây là sự khác biệt giữa củng cố tích cực và tiêu cực. Vì chúng ta nghĩ về sự củng cố như một phần thưởng nên khó mà tưởng tượng làm sao sự củng cố có thể là tiêu cực. Tuy nhiên, củng cố tiêu cực không giống như sự trừng phạt. Vì củng cố luôn luôn làm tăng cường một phản ứng, nên củng cố tiêu cực cũng phải làm tăng sức mạnh của một hành vi. Hãy xem ví dụ sau. Bạn của bạn cần bạn đăng ký vé máy bay để hai bạn có thể đi du lịch cùng nhau. Tuy nhiên, bạn trì hoãn đăng ký. Bạn của bạn bắt đầu gửi những tin nhắn tức giận cho bạn và không dừng lại cho đến khi bạn đi đăng ký xong. Hành vi đăng ký vé của bạn được gia tăng bởi bằng cách thực hiện hành vi đó, bạn loại bỏ kích thích gây khó chịu của những tín nhắn tức giận của bạn của bạn.
Củng cố tiêu cực có ích trong việc thúc đẩy bản thân bạn thực hiện một hành vi được mong đợi khi bạn có thể quản lý những kích thích đáng ghét. Bạn có thể lập trình cho điện thoại của bạn gửi cho bạn một chuông báo động cứ sau mỗi 10 phút cho đến khi bạn thực hiện hành vi đó và sau đó bạn xóa chuông báo đó trong điện thoại.
Chúng ta thích nghĩ rằng hành vi của chúng ta phức tạp hơn nhiều so với một chú bồ câu trong cái hộp Skinner. Nhưng bằng cách làm theo một vài chỉ dẫn của nhà hành vi, bạn có thể thấy mình có thể tổ chức những sự củng cố cho riêng bạn theo cách có thể thúc đẩy bạn hướng đến sự thay đổi hành vi, đem lại sự thỏa mãn.
Nguồn
How to Motivate Yourself Effectively Through Reinforcement
Put behaviorism to work for you by figuring out which rewards make you tick
Published on October 1, 2013 by Susan Krauss Whitbourne, Ph.D. in Fulfillment at Any Age
PsychologyToday
Một trong những cống hiến chính của Skinner là nhấn mạnh giá trị của sự củng cố tích cực. Skinner chỉ ra rằng nếu bạn muốn một ai đó thay đổi, tốt hơn là bạn nên sử dụng củ cà rốt hơn là cây gậy. Trừng phạt con người vì có hành vi xấu ít có khả năng khiến họ thay đổi so với cho họ sự động viên để làm những việc bạn muốn họ làm. Trong thực tế, trừng phạt có thể gây phản tác dụng với ý định của bạn, làm họ trở nên tức giận hoặc sợ hãi.
Bây giờ hãy nói về cách làm thế nào để thúc đẩy bản thân bạn. Chúng ta vừa thấy trừng phạt người khác không phải là chiến lược tốt nhất để làm họ thay đổi hành vi của họ, và điều đó cũng đúng khi nói đến việc thay đổi hành vi của riêng bạn. Bạn dễ dàng chì chiết, trừng phạt bản thân vì không đạt được những mục tiêu của bạn, nhưng kết quả cuối cùng sẽ chỉ khiến bạn trở nên nhụt chí, chán nản hơn bao giờ hết.
Bước đầu tiên trong việc sử dụng củng cố để thúc đẩy bản thân là xác định những phần thưởng sẽ có hiệu quả để giúp bạn thay đổi. Bạn thực sự yêu thích những hoạt động gì? Bạn đặc biệt giỏi về lĩnh vực gì? Nếu bạn có thể liệt kê 4 hoặc 5 phần thưởng mà bạn biết bạn sẽ nỗ lực để đạt được chúng thì bạn có thể thúc đẩy bản thân hành động. Có thể hành vi bạn thấy là đem lại phần thưởng lớn nhất cũng chính là hành vi bạn đang cố gắng thay đổi (như hút thuốc, ăn quá nhiều, không tập thể dục, chơi game). Điều này ok. Chừng nào bạn gắn liền một phần thưởng với một sự thay đổi trong hành vi (hút thuốc ít đi, ăn ít, tập thể dục nhiều hơn, dành ít thời gian hơn cho game), thì bạn có thể vẫn thu được hiệu quả với phần thưởng này. Nhưng có lẽ bạn nên chọn một hành vi (được xem là một phần thưởng) khác với hành vi bạn đang cố gắng thay đổi.
Thứ hai, xác định những phần thưởng nào đang duy trì hành vi của bạn hiện tại. (Ý là một hành vi dù xấu nhưng nó phải có lợi cho bạn thì nó mới tiếp tục tồn tại. Cái lợi đó chính là phần thưởng). Điều gì ở game online khiến bạn tiếp tục muốn chơi nhiều hơn? Tại sao bạn đánh bạc quá nhiều ngay cả khi bạn liên tục thua? Điều gì quyến rũ đằng sau việc đi mua sắm bốc đồng của bạn? Skinner khám phá ra rằng hành vi của chúng ta được duy trì ở những mức độ khác nhau phụ thuộc vào kiểu củng cố. Những con vật trong “cái hộp Skinner” của Skinner cho thấy những kiểu phản ứng khác nhau dựa trên khi nào và trong những tình huống nào chúng nhận được phần thưởng. Dù có nhiều khả năng thu được một hành vi khi nó được thưởng mỗi lần hành vi xuất hiện, một khi hành vi được thiết lập thì những chú bồ câu sẽ mổ nhiều hơn để có một dĩa thức ăn nếu phần thưởng đó chỉ thỉnh thoảng mới xuất hiện. Những kiểu “lúc có lúc không” đó của sự củng cố khiến những chú bồ không trở nên lười biếng và tự bằng lòng. Còn với kiểu liên tục, vì chúng có được phần thưởng mỗi lần chúng mổ một cái đòn bẩy nên chúng chỉ mổ khi chúng thực sự cần phần thưởng. Còn với kiểu “lúc có lúc không” thì phần thưởng trở nên ít dự đoán được hoặc ít ra là không dễ đạt được.
Có 2 mặt với những kiểu củng cố. Thứ nhất là kiểu củng cố: cố định hay thay đổi. Thứ hai là nền tảng cho sự củng cố. Nó có 2 loại: Củng cố dựa trên thời gian: bạn sẽ có được phần thưởng nếu bạn thực hiện hành vi được mong muốn tại bất kỳ thời điểm nào trong khoảng thời gian nào đó; củng cố dựa trên phản ứng: bạn nhận được phần thưởng cho mỗi x lần phản ứng đúng bạn thực hiện.
Đặt tất cả các kiểu củng cố với nền tảng củng cố, bạn sẽ có 4 kiểu củng cố:
Thời gian cố định: Một phần thưởng xuất hiện nếu hành vi được mong muốn xuất hiện vảo một thời điểm cụ thể. Ví dụ “Giảm giá vào Thứ ba”, khi đó khách hàng sẽ được giảm một khoản tiền nhất định vào ngày cụ thể đó. Nếu bạn biết mình sẽ được giảm giá thì bạn sẽ mua món hàng nào đó vào thứ ba hơn là thứ hai.
Thay đổi thời gian: Một phần thưởng xuất hiện nếu hành vi được mong đợi xuất hiện, trong suốt một khoảng thời gian nào đó. Đây là một chiêu khuyến mãi phổ biến được sử dụng ở những nhà ga thông báo bạn sẽ giành được một phần thưởng nếu bạn là người gọi thứ 10, ví dụ ở một thời điểm như từ 9-10h. Cơ hội phần thưởng có thể được trao cho lúc 9:05, 9:25, hoặc 9:58.
Phản ứng cố định: Bạn có được một phần thưởng cho mỗi x lần phản ứng bạn thực hiện. Một quán café khuyễn mãi thêm 1 cốc café miễn phí sau khi bạn mua đủ 10 cốc.
Phản ứng thay đổi: Bạn có được một phần thưởng cho đáp ứng, theo trung bình, mỗi “xth” lần. Ví dụ, một game online tặng thêm tiền cho bạn khi bạn chơi đến trò thứ 25. Hoặc bạn gái của bạn sẽ cười trước câu chuyện đùa của bạn chỉ đến khi bạn kể đến câu chuyện thứ 5. Bạn biết bạn sẽ có được một nụ cười, nhưng bạn không thể đoán được khi nào cô ấy sẽ thưởng cho bạn.
Nếu bạn đang bị dính mắc vào một thứ gì đấy thì khả năng là nó đem lại sự củng cố “phản ứng thay đổi”. Bạn không bao giờ biết khi nào bạn sẽ được thưởng, dù bạn biết qua kinh nghiệm rằng phần thưởng sẽ đến vào một thời điểm nào đó. Do đó, bạn tiếp tục thực hiện hành vi với một mức độ cao và đều đều. Vì bạn có thể không biết chính xác bạn đang ở đâu trong chuỗi củng cố (trò chơi thứ 1 hay thứ 25 sẽ đem lại phần thưởng), kiểu củng cố này tạo ra hành vi chống lại sự dập tắt cao. Tất cả những gì nó cần là một phần thưởng và bạn sẽ tiếp tục thực hiện hành vi.
Kiểu củng cố “phản ứng cố định” cũng có xu hướng đem lại tỷ lệ phản ứng cao vì phần thưởng nằm trong sự kiểm soát của bạn. Tuy nhiên, vì bạn biết khả năng nhận được phần thưởng nên bạn có thể dừng thực hiện hành vi và nghỉ ngơi sau khi thực hiện nó.
Kiểu củng cố “thay đổi thời gian” có thể khiến bạn phản ứng thường xuyên, nhưng vì thời gian không nằm dưới sự kiểm soát của bạn, nếu khoảng thời gian đủ dài thì bạn sẽ nghĩ ngơi cho đến khi phần thưởng tiếp theo sẵn sàng.
Bạn sẽ phản ứng ít thường xuyên nhất nếu hành vi của bạn được duy trì bởi kiểu củng cố “thời gian cố định.”
Những ví dụ hằng ngày cho thấy chúng ta điều chỉnh hành vi của chúng ta như thế nào trước kiểu củng cố được quy định bởi những nhà quảng cáo, sếp, người yêu hoặc thậm chí bản thân chúng ta.
Hãy xem thử kiểu củng cố nào có lợi cho bạn. Nếu bạn biết rằng bạn sẽ phản ứng thường xuyên nhất và lâu nhất trước kiểu củng cố “phản ứng thay đổi” thì điều này có thể giúp bạn giải thích một số hành vi mang tính nghiện ngập và cưỡng bách của bạn. Còn nếu bạn không được thúc đẩy đủ để thực hiện một hành vi? Đó có phải vì kiểu củng cố “thời gian cố định”?
Như vậy, với kiến thức về kiểu củng cố, bạn có thể hiểu hành vi của bạn có thể bị kiểm soát như thế nào bởi những tác động mà bạn không nhận ra. Chỉ có một điểm giúp bạn sử dụng củng cố để có lợi cho bạn. Đây là sự khác biệt giữa củng cố tích cực và tiêu cực. Vì chúng ta nghĩ về sự củng cố như một phần thưởng nên khó mà tưởng tượng làm sao sự củng cố có thể là tiêu cực. Tuy nhiên, củng cố tiêu cực không giống như sự trừng phạt. Vì củng cố luôn luôn làm tăng cường một phản ứng, nên củng cố tiêu cực cũng phải làm tăng sức mạnh của một hành vi. Hãy xem ví dụ sau. Bạn của bạn cần bạn đăng ký vé máy bay để hai bạn có thể đi du lịch cùng nhau. Tuy nhiên, bạn trì hoãn đăng ký. Bạn của bạn bắt đầu gửi những tin nhắn tức giận cho bạn và không dừng lại cho đến khi bạn đi đăng ký xong. Hành vi đăng ký vé của bạn được gia tăng bởi bằng cách thực hiện hành vi đó, bạn loại bỏ kích thích gây khó chịu của những tín nhắn tức giận của bạn của bạn.
Củng cố tiêu cực có ích trong việc thúc đẩy bản thân bạn thực hiện một hành vi được mong đợi khi bạn có thể quản lý những kích thích đáng ghét. Bạn có thể lập trình cho điện thoại của bạn gửi cho bạn một chuông báo động cứ sau mỗi 10 phút cho đến khi bạn thực hiện hành vi đó và sau đó bạn xóa chuông báo đó trong điện thoại.
Chúng ta thích nghĩ rằng hành vi của chúng ta phức tạp hơn nhiều so với một chú bồ câu trong cái hộp Skinner. Nhưng bằng cách làm theo một vài chỉ dẫn của nhà hành vi, bạn có thể thấy mình có thể tổ chức những sự củng cố cho riêng bạn theo cách có thể thúc đẩy bạn hướng đến sự thay đổi hành vi, đem lại sự thỏa mãn.
Nguồn
How to Motivate Yourself Effectively Through Reinforcement
Put behaviorism to work for you by figuring out which rewards make you tick
Published on October 1, 2013 by Susan Krauss Whitbourne, Ph.D. in Fulfillment at Any Age
PsychologyToday