Что такое промпт и еще 8 непонятных слов про нейросети

8 164

Что такое промпт и еще 8 непонятных слов про нейросети

8 164

Что такое промпт и еще 8 непонятных слов про нейросети

8 164

Сегодня пользоваться нейросетями могут даже те, кто не работает в IT, не пишет код и не знает никаких терминов. Но ознакомиться с ними всё же стоит, потому что технология новая и о ней постоянно говорят (даже ваш ребенок на перемене). Мы воспользовались сервисом Яндекса «Нейро», новым способом искать не ссылки, а конкретные ответы, и собрали 9 описаний важных терминов из мира ИИ.

Начнем с самых основ. Искусственный интеллект (от английского Artificial Intelligence, чаще всего его называют AI или ИИ) — это целая область компьютерных исследований и технологий, которые создают систему, подобную человеческому мозгу. Отсюда и название. ИИ может учиться, рассуждать, планировать, воспринимать и обрабатывать информацию аналогично человеку.

В этом ему помогают нейросети, математические модели, которые помогают обрабатывать информацию. Люди часто путают нейросети и ИИ, хотя одно является лишь частью другого.

В контексте ИИ модель — это программа, обученная на определенных видах данных и алгоритмов. Условно говоря, разные модели алгоритмов используются для предсказаний, решения математических уравнений, сортировки накопившихся данных и так далее. Например, когда мы открываем приложение погоды, в нем используется модель для расчета изменения погодных условий.

Другие модели можно использовать для создания изображений, поиска и выдачи информации. Как, например, модели семейства YandexGPT 3, которые отвечают за новые функции поиска в «Нейро».

Разобрались, что ИИ состоит из разных моделей и массивов данных. Но как определить, какие данные важны, а какие нет? Для этого всем выдается определенный «вес». Например, когда нейросети обучали отличать кошек и собак, их фотографиям задавали разные веса, чтобы робот не запутался: условно говоря, кошка — это 1, а собака — 0.

Работает это так: если нейросеть должна найти для пользователя фотографии собак, то у них будет больше веса, чем у картинок с черепахами или с котами. В модели распознавания рукописного текста веса будут настроены таким образом, чтобы выделять ключевые особенности букв, такие как линии и кривые, для точного распознавания символов.

Современные нейросети могут не только обрабатывать информацию из интернета и уже обработанных источников, но и «видеть» самостоятельно. Уже сейчас в приложении Яндекса доступна «умная камера», через которую можно искать предметы на маркетплейсах, узнавать историю достопримечательностей, определять породы собак или названия растений.

По сути компьютерное зрение — это алгоритм, который анализирует информацию с изображения в реальном времени, распознает разные объекты и сравнивает их с теми базами данных, которые уже есть в системе. Принцип такой же, как у человеческого зрения.

Например, новый сервис «Нейро» от Яндекса умеет через вашу камеру искать информацию. К примеру, можно узнать породу собаки, которая стоит прямо перед вами. Или узнать автора картины, архитектора здания и многое другое. За всё это отвечает компьютерное зрение и разработка.

Нейросеть — это сложноустроенный инструмент, который человек без профильного образования не сможет ни понять, ни использовать. Но как же тогда ими уже пользуются все, включая школьников? С помощью чат-ботов — программы или интерфейса, который имитирует общение с реальным человеком. Вы сто процентов пользовались чат-ботами в мессенджерах. Выглядит это как общение с роботом: вы отправляете ему сообщение с просьбой, а он вам выдает результат.

Но чат-боты вроде ChatGPT или Алисы — не единственная платформа для взаимодействия с нейросетью. Например, через поисковик «Нейро» можно найти не только череду ссылок или выжимку из статьи, но и ответ, составленный конкретно под ваш запрос.

В интернете нулевых слово «промпт» тесно ассоциировалось с программой для перевода, которая очень плохо справлялась со своими задачами. А вообще глагол to prompt означает «побуждать, внушать, подсказывать». В IT-среде промптом называют текст, который вы отправляете в нейросеть, чтобы получить результат. От правильно составленного промпта зависит релевантность информации, которую искусственный интеллект выдаст вам в ответ.

Не любая команда будет считаться промптом. Например, «включи веселую музыку» — это обычный запрос, который побуждает к действию. А «напиши сочинение про философию Достоевского, используй ссылки на литературоведов» это уже настоящий промпт, который даст нейросети целый ряд указаний к действию и «творчеству».

Чтобы нейросетями могли пользоваться как можно больше людей, разработчики стараются максимально упростить промпты. Так, в поисковике «Нейро» от Яндекса можно писать запрос так, будто вы задаете вопрос человеку — не нужно думать о том, что общаешься с алгоритмом.

Здесь всё просто. Датасет (data set) — это набор данных, который используется для обучения и тестирования моделей машинного обучения. Датасеты могут содержать структурированную или неструктурированную информацию, такую как текст, изображения, аудио и видео. От того, насколько качественные и рассортированные данные в датасете, зависит скорость обучения самой модели.

Но если нейросети обучаются на такой горе данных, сколько же это весит? Наверное, нужны огромные сервера на терабайты данных? Вовсе нет, ведь на помощь приходит пулинг (pooling) — техника, которая уменьшает размер данных. Работает это так: у каждой единицы в датасете выделяется самый важный параметр, а остальная информация удаляется. Именно благодаря пулингу нейросети могут оценить все фильмы в жанре «детектив» меньше чем за минуту.

Слово года по версии Кембриджского словаря означает явление, когда нейросеть выдает неверные или абсурдные ответы. Поскольку ИИ еще развивается, он может делать странные ошибки, которые будут либо забавными, либо даже опасными для здоровья человека. Именно поэтому пока что люди временят с использованием нейросетей в медицине или ядерных технологиях, внедряя их постепенно.

ИИ могут «галлюцинировать» из-за недостатка данных обучения или ошибки в самом алгоритме. Так, компании Google пришлось несколько раз переделывать свою модель Gemini, чтобы исправить самые явные ошибки. Хорошая новость — ошибки исправляются очень быстро, так что идеальный ИИ без галлюцинаций уже не за горами.

Мы собрали эту статью с помощью «Нейро» — нового сервиса в приложении Яндекс с Алисой, который знает ответы на любые вопросы, ведь он берет знания прямо из интернета. Больше не придется прыгать по куче ссылок, чтобы получить нужную информацию, поиск за вас проведет нейросеть. «Нейро» может работать не только с текстом, но и с изображениями. А если конкретного вопроса у вас нет, то можно просто написать свое пожелание в чат-бот — и сервис сам задаст наводящие вопросы. Удобно и просто, даже термины новые учить не придется! Но главное — для каждого результата «Нейро» проводит фактчек и ссылается на источники, так что всё можно перепроверить самостоятельно. Сервис без проблем объяснит и расшифрует любые непонятные слова!

Обложка: Shutterstock.AI / Shutterstock / Fotodom

Реклама. ООО «Яндекс», erid: LjN8JvHUA