Глубокая наука

В то же время глубокое обучение доказало свою пользу в ряде научных задач. «Глубокие сети действительно хороши в поиске схем в наборе данных», — говорит Хинтон. В 2012 году фармацевтическая компания «Merck» назначила вознаграждение тому, кто сможет превзойти лучшую программу, которая помогает оценить пользу кандидатов в лекарства. Задача: проверить базу данных из более чем тридцати тысяч малых молекул, каждая из которых имеет тысячи числовых дескрипторов химических свойств, и попытаться определить, как именно каждый из них будет действовать в пятнадцати различных целевых молекулах. Джордж Даль и его коллеги получили двадцать две тысячи долларов благодаря системе глубокого обучения. «Мы улучшили базовую линию «Merck» почти на пятнадцать процентов», — говорит он.

Исследователи по биологии и вычислениям, включая Себастьяна Сеунга (Sebastian Seung) из Массачусетского технологического института в Кембридже, используют глубокое обучение для того, чтобы облегчить анализ трехмерных изображений срезов мозга. На этих изображениях переплетенные линии отражают связи между нейронами, которые нужно определить так, чтобы их можно было нанести на карту и посчитать. Когда-то в прошлом к этой работе привлекали аспирантов, однако автоматизация процесса стала единственным вариантом справиться с миллиардами связей, которые, скорее всего, вскоре будут определены в рамках этих проектов. Глубокое обучение, кажется, станет лучшим способом автоматизации в данной сфере. Сеунг сейчас использует программы глубокого обучения для определения нейронов с большого скопления сетчатки, а затем пересылает результаты на проверку волонтерам онлайн-игры «EyeWire».

Уильям Стаффорд Нобл (William Stafford Noble), ученый компьютерных наук из Университета Вашингтона в Сиэтле, использовал глубокое обучение для того, чтобы его программа научилась исследовать нити аминокислот и предусматривать структуру белка, который должен был с ним образоваться, при этом определенные части образуют, например, шестиугольник или петлю. Нобл до сих пор тренировал свою программу на малых объемах данных, а в ближайшие месяцы займется Базой данных белков (Protein Data Bank): мировым хранилищем, которое сейчас содержит данные о примерно 100 000 структур.