Нейробиология(мозг)

Новое исследование проливает свет на то, как мозг учится искать вознаграждение

Лайнуть/Поделиться

Вознаграждение не просто подкрепляет конкретное действие – оно быстро меняет всю модель нашего поведения.

Представьте, что вы учите собаку играть в мяч. Вы бросаете мяч, собака бежит за ним, подхватывает его и бежит обратно. Затем вы награждаете своего запыхавшегося щенка лакомством. И теперь собака должна понять, какая часть последовательности действий принесла ей лакомство. Ученые называют это “проблемой предназначения похвалы” в мозге. Это фундаментальный вопрос о том, как понять, какие действия ответственны за положительные результаты, которые мы испытываем.

Известно, что дофамин, ключевой химический мессенджер в мозге, играет решающую роль в этом процессе. Но как именно мозг связывает конкретные действия с выбросом дофамина, до сих пор остается неясным.

Исследование, опубликованное вчера, 13.12.2023, в журнале Nature учеными из Института Аллена, Института поведения мозга Цукермана при Колумбийском университете, Центра Шампалимо и Детского научно-исследовательского института Сиэтла, проливает новый свет на эту загадку. Оно показывает, как дофамин не только сигнализирует о вознаграждении, но и помогает животным методом проб и ошибок выбирать конкретные модели поведения, которые приводят к этому вознаграждению.

Интригующе, но исследование также показывает, что система вознаграждения мозга может быстро и динамично изменять весь спектр движений и поведения животного. По словам старшего автора исследования Руи Коста, это говорит о сложной стратегии обучения, при которой поведение не просто подкрепляется, а активно формируется и настраивается в процессе опыта.

“Когда вы подкрепляете поведение, мы часто думаем, что это просто действие”, – сказал Коста, президент и генеральный директор Института Аллена. “Но нет: вы меняете всю структуру поведения. И что действительно удивительно, так это то, насколько быстро это происходит”.

Расшифровка того, как дофамин формирует обучение

Для того чтобы выяснить это, команда сотрудничала с инженерами и нейробиологами из Центра Шампалимо, чтобы разработать новую систему “замкнутого цикла”, которая могла бы связать определенные действия мышей с высвобождением дофамина в режиме реального времени. Исследователи оснастили мышей беспроводными датчиками, чтобы отслеживать их перемещения в простом контролируемом пространстве. Затем они передали эти данные в алгоритм машинного обучения, который разделил эти действия на отдельные группы. Затем исследователи использовали оптогенетику – метод управления нейронами с помощью света – для стимуляции дофаминовых нейронов, когда мыши выполняли заранее определенные “целевые действия”.

Они обнаружили, что мыши быстро меняли свое поведение в ответ на высвобождение дофамина. Сначала они увеличивали частоту не только целевых действий, но и сходных с ними, а также тех, которые происходили за несколько секунд до выброса дофамина. При этом частота действий, непохожих на целевые, быстро снижалась. Со временем это уточнение становилось все более точным, и мыши все чаще фокусировались именно на том действии, которое приводило к выбросу дофамина.

В исследовании также изучался процесс обучения мышей серии действий, что позволило выявить ключевой процесс, похожий на перемотку времени для понимания того, что приводит к вознаграждению. Когда действия, вызывающие выброс дофамина, происходили на большом расстоянии друг от друга, мыши учились медленнее. Это говорит о том, что при более длительных промежутках между действиями мышам сложнее связать последовательность действий с вознаграждением. По сути, действия, предшествующие вознаграждению, быстро усваиваются и совершенствуются, в то время как более ранние действия совершенствуются постепенно. Этот процесс “перемотки” закрепляет поведение и помогает мышам постепенно определить, какие именно действия и последовательности приносят награду.

По словам ведущего автора Джонатана Танга (Jonathan Tang), доктора философии, доцента Медицинского института Университета Вашингтона по педиатрии и Детского научно-исследовательского института Сиэтла, полученные результаты могут повлиять на такие области, как образование и искусственный интеллект (ИИ). Например, возможность исследования, ошибок и постепенного совершенствования в классе может больше соответствовать врожденным процессам обучения нашего мозга.

В искусственном интеллекте эти знания могут привести к созданию более сложных и эффективных систем обучения. Более точно воспроизведя биологические процессы обучения, мы сможем создать ИИ, который будет лучше адаптироваться к новым данным и ситуациям.

Это исследование позволяет глубже понять, как наш мозг учится и адаптируется путем проб и ошибок – будь вы ученый или школьник.

“Мы считаем само собой разумеющимися многие вещи, включая предназначение похвалы”, – говорит Танг, который начал исследование вместе с Костой во время учебы в Колумбийском университете. “Но когда вы действительно начинаете погружаться внутрь, вы осознаете всю сложность. Именно поэтому люди занимаются наукой: чтобы докопаться до истины”.

Исследование(закрытое): Tang, J.C.Y., Paixao, V., Carvalho, F. et al. Dynamic behaviour restructuring mediates dopamine-dependent credit assignment. Nature (2023). https://doi.org/10.1038/s41586-023-06941-5


Вознаградить админа можно по этим реквизитам:

  • PayPal/BinancePay: maximleo2@gmail.com
  • USDT (TRC 20): TLwprbnDEfh89GW75NbM7diPLDXXWLQsRh
  • ETH: 0x0f3caa9e1e69aae0e23fb039e74b5093c3427d75
  • BTC: 1LSvFymP9hANhiQ1VfeCFn1udLwETczfgq
  • Номер карты МоноБанки: 5375411204212299
Редакция

Опубликовала
Редакция
Метки: поведение

Недавние публикации

Охотники-собиратели были жестоко стерты с лица земли фермерами, согласно анализу ДНК

Вопреки сложившемуся мнению, мирного перехода власти от охотников-собирателей к земледельцам в Европе не было. Новый… Читать далее

14/02/2024

Синдром Котара: Люди думают, что они мертвы

Синдром Котара - психопатологическое расстройство, которое еще называют нигилистическим бредом или синдромом "ходячего мертвеца". Человек… Читать далее

12/02/2024

Как синие ягоды обретают свой цвет без синего пигмента?

Группа исследователей из Великобритании и Германии обнаружила, что восковой налет на фруктах, который обычно придает… Читать далее

10/02/2024

0 случаев рака шейки матки у привитых от ВПЧ женщин Шотландии с 2008 года

Новое захватывающее исследование, проведенное организацией Public Health Scotland (PHS) в сотрудничестве с университетами Стратклайда и… Читать далее

04/02/2024

Почему летающие насекомые собираются при искусственном освещении?

Ночью в облачном лесу Коста-Рики небольшая международная группа ученых включила свет и стала ждать. Вскоре… Читать далее

31/01/2024

Гриб вырабатывает антибиотик, чтобы успешно заражать насекомых, защищенных бактериями

Паразитический гриб Боверия Басси использует антимикробное соединение, чтобы атаковать защитные бактерии на поверхности тела плодовых… Читать далее

30/01/2024