Я думал вот над чем. Современные нейронки получают свои знания в два этапа. На первом тренируют их нейронную сеть, показывая ей много текста. Таким образом она научается предсказывать текст. На втором, уже после дополнительной настройки, вы разговариваете с ботом, чью речь нейронка предсказывает, и сообщаете ему информацию. Эта информация доступна для нейронки не таким образом, как прежняя. Тренировочные сведения улеглись в ней прочно и стали её частью. Эти сведения, которые вы написали в разговоре - входные данные.
Представьте, что вы взяли нейронку, и несколько раз показали ей - в форме тренировки - совершенно новую книгу, которую она прежде не видела и ничего о ней не знает. Что при этом произойдёт? Нейронка запомнит имена персонажей и свяжет их с названием книги. Возможно, запомнит ещё кое-какие мелкие ассоциации и сюжетные приёмы. Но если вы её попросите пересказать книгу, она не сможет этого сделать. И скорее всего, не ответит на большинство вопросов о сюжете.
(Почему?)Почему? Потому, что в результате тренировки в её субстрате сохраняются только уже сформированные факты, на которых её тренировали. Найденные P-решения NP-задач. Вернее было бы спросить, почему нейронка может пересказать другие книги, кроме этой новой? Это потому, что она уже видела пересказы этих книг. В интернете полным-полно пересказов. Она не обязательно повторит их в точности. Но она интегрировала достаточно крупиц этой сложной информации, чтобы теперь комбинировать их. У одного прохода нейронной сети достаточно вычислительной мощности, чтобы смешивать обломки ответов неожиданным образом (речь не о смешении слов, а о смешении логики и идей, естественно). Но её мало, чтобы найти новые ответы.
Но и нейронка, если поместить текст книги в разговор, перескажет его и ответит на вопросы. На первый взгляд, можно сказать: конечно, ведь она видит текст. Но она видела этот текст на тренировке, и неоднократно! Почему *тогда* она не сделала из него выводов?
Потому, что вопросов можно задать множество, и выводов сделать сотни, и каждый это P-решение NP-задачи, каждый требует поиска. А мощность одного прохода нейросети ограничена. Нейронка не может, каким бы образом она не была устроена, за один проход ответить на все возможные вопросы. Поэтому она не может запомнить все возможные ответы при тренировке. Буквальный текст книги может быть даже сохранён в её ассоциациях. Но одного прохода по-прежнему недостаточно, чтобы извлечь его и проанализировать.
А вот если вы попросите её напечатать текст рассказа и затем ответить на вопрос, то она сможет. Узнали? Чтобы ответить на вопрос учителя о стихотворении, вы сначала вспоминаете его.
Можно представлять себе это так: текст - это структура. Структура хранит идею. Идея это решение какой-то задачи. Нейросеть это преобразователь структур. Текст, который вы подаёте на вход, доступен для обработки как структура, со всеми своими идеями. Но текст, сохранённый в форме ассоциаций, сам является частью конвейра и недоступен для анализа его структуры и вычленения оттуда нужных идей. Пошагово можно извлечь его во входной буфер, где его структура будет доступна анализу.
Откуда же тогда ответы берутся у людей? Я легко могу вспомнить прочитанное и кое-как пересказать. А ведь я, как нейронка, просто читал, т.е. впускал в свои уши и глаза слова и тренировал себя на них.
Я стал спрашивать себя, на какие вопросы я могу дать ответы? В каких подробностях могу вспомнить сюжет? Как выясняется, не в таком уж большом числе подробностей. Я могу вспомнить жанр и общее впечатление о книге. Могу перечислить крупные вехи сюжета. Иногда мне запомнились какие-то подробности. Но список таких подробностей невелик. Чем больше я думал над книгой, тем лучше я её помню. Запоминаются те подробности, о которых я думал.
Это наводит на мысль, что на самом деле и мы не анализируем книгу на лету, и не усваиваем её вместе с сюжетом и ответами на вопросы. Этого не делает наш субстрат, наша нейронная сеть. Мы отвечаем на вопросы только тогда, когда задаём себе их. Когда обращаем своё внимание на них и запускаем обработку по шагам. Что и логично потому, что чудес не бывает: наша нейронная сеть тоже обладает ограниченной однопроходной мощностью, что нам хорошо известно ("надо подумать").
Но в отличие от нейронок, мы читаем книгу не совсем бездумно. Текст книги мы перемежаем собственными мыслями, которые имеют на нас одинаковый с книгой эффект. Мы читаем книгу и мы читаем свои мысли на её счёт, то и другое тренирует наши однопроходные, интуитивные реакции. За отношениями героев, например, мы наверняка следим почти бессознательно, потому, что это требуется в жизни, мы привыкли к этому.
Но если следить за своими мыслями, должно быть можно поймать себя на возникающих в голове реакциях. На паузах в чтении! Вот что главное. Мышление отличается от тренировки тем, что вы отвлекаетесь и уделяете несколько шагов нейронной сети не тому, что написано, а вопросу на этот счёт. Вопросу, который не может быть решён за один проход. Он может быть и не высказан в словах - мы всё же не словесно-ориентированные нейросети, а скорее понятийно-ориентированные. Но он потребует паузы в разборе книги. И эти паузы должны быть настолько частыми, насколько подробно вы запомнили сюжет.
Похоже это на правду? Можете ли вы, если кто-то это читает, заметить такое за собой?