Машина ажиотажа реальна с Генеративным ИИ и ChatGPT, которые в наши дни, кажется, повсюду в технологиях. Так что неудивительно, что мы начинаем слышать болтовню о новой, улучшенной Siri. Фактически, 9to5Mac уже заметил новую систему естественного языка.
Содержание статьи
Вы говорите на моем языке?
Утверждается, что Siri в бета-версии tvOS 16.4 имеет новую структуру «Siri Natural Language Generation». Как описано, это не звучит впечатляюще, так как в основном кажется, что оно сосредоточено на рассказывании (папа?) шуток, но также может позволить вам использовать естественный язык для установки таймеров. Он носит кодовое название «Бобкэт».
Эти шепоты следуют за недавним Газета «Нью-Йорк Таймс отчет о февральском саммите Apple по искусственному интеллекту. В этом отчете утверждалось, что на мероприятии особое внимание уделялось тому типу генеративного контента и больших языковых моделей (LLM), которые используются ChatGPT. В нем также говорится, что инженеры Apple «активно тестируют» концепции, генерирующие языки, каждую неделю внедряя новые языковые концепции, поскольку Apple стремится продвигать ИИ вперед.
Итак, создаем ли мы конкурента ChatGPT? Не совсем, по мнению Блумберг.
В то время как Siri казалась невероятно сложной, когда она впервые появилась, разработка не поспевает за темпами, давая дерзкому голосовому помощнику Apple отголоски MobileMe и Ping. Как и Apple, терпит неудачу, Siri обещала, что она так и не оправдала себя, и теперь отстает от помощников от Google и Amazon, несмотря на то, что она немного более приватна.
Отсутствие у Siri контекстуального чутья означает, что она действительно хороша только в том, чему ее научили делать, что ограничивает ее возможности; GPT, кажется, оставляет его в пыли. Благодаря недавнему обновлению GPT-4 OpenAI быстро внедряет инновации. Мы уже видим, что это зажгло огонь в крупных технологических фирмах. Microsoft внедрила ChatGPT в Bing, Google ускоряет разработку Palm, а Amazon активно продвигает AWS Chat (последний теперь интегрирован в Microsoft Teams).
Apple — и Siri — кажутся на грани.
Не тот и единственный
Конечно, Siri — не единственный искусственный интеллект (MI), над которым работает Apple. В некоторых областях, таких как доступность и увеличение изображения, он добился безумно хороших примеров правильного MI. Но почему-то Siri все равно ошибается.
Я не совсем уверен, как бы справился с этим Стив Джобс из Apple — я не вижу, чтобы он был счастлив, когда его HomePod говорит ему, что не может найти его треки Дилана. Разница между двумя голосовыми ИИ заключается в том, что я могу попросить GPT создать изображение, на котором он бросает этот умный динамик в стену.
Отчасти это связано с тем, как устроена Siri.
Как они сделали Siri
Siri — это своего рода огромная база данных ответов для различных областей знаний, дополненная результатами поиска, полученными в Spotlight, и интерпретацией естественного языка, чтобы вы могли говорить с ней. Когда делается запрос, Siri проверяет, понимает ли вопрос, а затем использует алгоритмы глубокого/машинного обучения для определения подходящего ответа. Чтобы получить этот ответ, он выполняет числовую оценку (показатель достоверности) вероятности того, что ответ правильный.
Это означает, что когда вы задаете Siri вопрос, она сначала быстро проверяет, является ли это простой просьбой («включите свет»), которую она может быстро выполнить на основе того, что она уже знает, или же ей нужно проконсультироваться. большая база данных. Затем он делает то, что вы просите его сделать (иногда), получает нужные вам данные (часто) или говорит вам, что не понимает вас, или просит вас изменить настройку, спрятанную где-то в вашей системе (слишком часто).
Теоретически, Siri так же хороша, как и ее база данных, а это означает, что чем больше ответов содержится в ней, тем лучше и эффективнее она становится.
Однако есть проблема. Как объяснил бывший инженер Apple Джон Берки, то, как устроена Siri, означает, что инженеры должны перестроить всю базу данных, чтобы обновить ее. Это процесс, который может занять до шести недель.
Это отсутствие реального обучения делает Siri и других голосовых помощников «тупыми как скала», по словам генерального директора Microsoft Сатьи Наделлы. Конечно, можно было бы ожидать, что он скажет что-то подобное, поскольку Microsoft вложила миллиарды в ChatGPT, который она вплетает в свои продукты.
Генеративный ИИ, с другой стороны
Генеративный ИИ (вид интеллекта, используемый в ChatGPT, Midjourney, Dall-E и Stable Diffusion) также использует естественный язык, собственные базы данных и результаты поиска, но также может использовать алгоритмы для создания оригинального контента, такого как аудио, изображения. или текст.
Вы можете задать ему вопрос, и он просмотрит все доступные данные и примет несколько решений, чтобы получить результат.
Теперь, как довольно часто отмечалось с тех пор, как люди начали изучать технологию, эти результаты не всегда великолепны или оригинальны, но обычно они кажутся убедительными. Возможность попросить его создать дипфейковые видео и фотографии делает это еще дальше.
При использовании один из способов увидеть разницу между двумя моделями ИИ — подумать о том, чего они могут достичь.
Таким образом, в то время как с помощью Siri вы можете запросить карту Лиссабона, Португалии или даже найти маршрут к какому-либо месту на этой карте, генеративный ИИ позволяет вам задавать более тонкие вопросы, например, какие части города он рекомендует написать. историю с действиями, происходящими в этом городе, или даже создать жутко точную фальшивую фотографию, на которой вы сидите в этом действительно прекрасном баре на Ларго-дус-Тригейрос.
Совершенно ясно, какой ИИ является наиболее впечатляющим.
Что будет дальше?
Это не должно быть так. Разработчикам удалось создать приложения для добавления ChatGPT в продукты Apple. watchGPT, который недавно был переименован в Petey — AI Assistant по причинам товарного знака, является отличным примером.
Apple вряд ли захочет уступить такую конкурентно важную технологию третьим сторонам, поэтому она, вероятно, продолжит работу над собственным решением, но на это могут уйти годы, в течение которых Siri все еще может не открыть дверь кабины.
Однако, учитывая, что GPT-4 стоит до 12 центов за тысячу подсказок, Apple вряд ли будет вплетать его в свои операционные системы в прямом смысле. С установленной базой, превышающей миллиард пользователей, это будет очень дорого, и Microsoft уже там.
Именно в этом контексте Apple может просто стиснуть зубы, чтобы облегчить своим разработчикам добавление поддержки технологии OpenAI в приложения, которые они создают, эффективно перекладывая расходы на них и их клиентов.
Это может помочь в краткосрочной перспективе, но я убежден, что это огонь в животе для команд искусственного интеллекта Apple. Теперь они будут вдвойне полны решимости развивать дальнейшие инновации в области обработки естественного языка, которая является ключевой для обеих технологий.
Но на данном этапе с точки зрения реализации они, похоже, отстали. Хотя внешний вид, как показывают изображения, сгенерированные с помощью GPT, может быть обманчивым.
Пожалуйста, следуйте за мной на Mastodon или присоединяйтесь ко мне в баре и гриле AppleHolic и Яблоко Обсуждения группы на MeWe.
Авторское право © 2023 IDG Communications, Inc.