ChatGPT — это все, о чем мир технологий может говорить в последнее время, и не без оснований. Инструмент на основе ИИ впечатляет, но есть и множество поводов для беспокойства — нарушение авторских прав, плагиат, использование в классах, даже потеря работы, поэтому неудивительно, что люди, которые зарабатывают на жизнь, переживают из-за ИИ, который, казалось бы, может писать хорошо. Но есть и технологические компании с блестящими глазами, которые видят будущее — способность компьютеров общаться естественным образом и создавать контент, который бизнес может реально использовать, в масштабе, скорости и стоимости, с которыми люди не могут сравниться.
Но ChatGPT, Google Bard и чат Microsoft Bing — это лишь малая часть революции генеративного ИИ. В течение прошлого года мир искусства гудел о новых генеративных художественных инструментах искусственного интеллекта и беспокоился о тех же проблемах — предвзятости, авторских правах, потерянных рабочих местах и т. д. Глубокие подделки, когда нейронные сети заменяют людей в видео с потрясающей реалистичностью, были вершиной. айсберга.
Эти инструменты не просто вспышка в кастрюле. Они в зачаточном состоянии и становятся лучше очень быстро. Крупные технологические компании, такие как Google и Microsoft, рассматривают этот новый генеративный ИИ как огромную часть всего нашего будущего. Заявить о себе и занять лидирующую позицию для них так же важно, как доминировать в Интернете в 90-х годах.
Но есть один игрок, которого нет в игре: Apple. Кажется, что самая ценная технологическая компания в мире полностью упускает из виду полную революцию в вычислительной технике. Apple знакома с искусственным интеллектом — она вызвала революцию в области помощников с помощью Siri, — но она также уже растратила свое лидерство, не инвестируя достаточно много, чтобы отбиваться от конкурентов.
Повторяется ли история с генеративным ИИ? Или у Apple есть что-то удивительное в рукаве, и она просто невероятно скрытна, как всегда?
Содержание статьи
ИИ, который анализирует, устарел, создание ИИ — это новое
Все крупнейшие технологические компании уже много лет кричат об ИИ. ИИ, который изолирует и анализирует вашу речь для диктовки и голосовых помощников, а также может различать голоса для получения персонализированных результатов. ИИ, который собирает воедино записанные звуки, чтобы «разговаривать» с вами. ИИ, который изолирует части изображений, чтобы их можно было легко редактировать. ИИ, который идентифицирует объекты и людей, чтобы помочь вам в поиске. ИИ, который позволяет выделить текст на любом изображении.
Apple делает все это. Для компании настолько важно, что они встраивают Neural Engine во все свои чипы, специализированное оборудование, которое ускоряет такие задачи машинного обучения. Apple даже работает над самой большой проблемой искусственного интеллекта — беспилотными автомобилями.
Но генеративный ИИ это что-то другое. Это более новый класс ИИ, который создает что-то совершенно новое, почти не используя текстовый ввод. Да, обучение моделей занимает массу времени и кучу данных, но тогда модели, которые будут запускать пользователи, сравнительно малы и, казалось бы, могут создать бесконечное количество новых вещей. ИИ, который может найти всю картошку в вашей фотобиблиотеке, совершенно отличается от того, который может нарисовать картошку с нуля в самых разных художественных стилях.

Марк Хачман / IDG
ChatGPT, Bard и Bing
Технология генеративного искусственного интеллекта, вызывающая заголовки, сейчас — это ChatGPT от OpenAI. Усовершенствованный чат-бот и инструменты, созданные на его основе, уже используются в деловом мире для создания статей, электронных писем, шаблонов и многого другого, что вызывает некоторые споры. Студенты используют его, чтобы написать целые работы из небольшой подсказки, и результаты достаточно хороши, чтобы начать гонку за разработкой хороших инструментов для учителей, чтобы идентифицировать написанные ChatGPT задания.
Поскольку он был обучен на тонне веб-данных, которые, хотя и устарели, по-прежнему актуальны для многих вещей, он может быть почти похож на поисковую систему, с которой вы общаетесь. Это так сильно взбесило Google, что она объявила о своем собственном конкурирующем продукте для разговорного ИИ, Bard, который еще не совсем готов к опробованию в мире, но скоро появится. Публичная демонстрация предоставила неверную информацию о космическом телескопе Джеймса Уэбба, поэтому Google явно есть над чем поработать.
Microsoft также анонсировала новую функцию разговорного поиска, которую вы можете начать использовать прямо сейчас в браузере Bing и Edge. Он построен на ChatGPT с некоторыми улучшениями и модификациями.
Это больше, чем просто игрушки или диковинки. Это настоящие инструменты, которые люди используют для выполнения реальной работы и реализации творческих проектов. Это только первые дни, и иногда кажется, что он не готов для мира в целом, но темпы совершенствования и инноваций ошеломляют — модели ИИ удваиваются в сложности и изощренности каждые шесть месяцев.
Стабильная диффузия, промежуточный этап, DALL-E
И это не только письменное слово. Мы все хорошо посмеялись над глупыми подсказками с DALL-E 2 в прошлом году, но с дальнейшим обучением и улучшениями эти генеративные художественные инструменты ИИ стали пригодны для гораздо большего, чем просто создание изображений кошек в стиле аниме, ныряющих с аквалангом с аквариумами. их головы.
Midjourney и Stable Diffusion стали настолько хороши, что создают произведения искусства, которые легко могли бы украсить обложку журнала, а за несколько минут их может быть несколько десятков.
Эти инструменты могут делать гораздо больше, чем просто создавать совершенно новые изображения в самых разных стилях. Они могут изменять входные изображения. App Store уже наводнен приложениями для создания аватаров и профилей, которые используют это программное обеспечение, чтобы сделать несколько фотографий вашего лица и изменить их потрясающим образом, изменив физические характеристики без ведома кого-либо. Например, надеть солнцезащитные очки, которые выглядят совершенно настоящими.
В прошлом году это был трюк, но технология развивается так быстро, что это уже инструмент. Adobe уже улучшила многие свои приложения с помощью инструментов для создания изображений на основе искусственного интеллекта, для восстановления фотографий одним щелчком мыши и значительно улучшенного удаления объектов. Но компания планирует вскоре добавить в свой набор инструментов значительный генеративный ИИ, позволяющий буквально вставлять изображения в существующие фотографии и рисунки, которые выглядят так, как будто они подходят.

Dall-E 2 — это больше, чем просто забавная трата времени для создания дурацких изображений.
Dalle2.app
Узкое окно для действий
И где во всем этом Apple? Компания позиционирует себя как технологического лидера, особенно в творческом пространстве. Но, за исключением нескольких сообщений в блоге с исследовательского сайта машинного обучения и некоторых относительно несложных оптимизаций библиотек для Apple Silicon, Apple кажется сидеть этот один из. Я имею в виду, я думаю, что DiffusionBee от Divam Gupta очень крутая, но это небольшое независимое стороннее приложение, которое не обновлялось довольно долгое время и уже отстает от современного искусства создания изображений AI.
Эта технология будет полностью трансформирующей. Не верите мне? Ознакомьтесь с исследованиями OpenAI в области создания музыки. Он создает новую музыку в различных стилях, включая пение, совершенно из ниоткуда. VALL-E от Microsoft может генерировать поразительно реалистичные голоса, которые звучат очень близко к реальному человеку, используя в качестве входных данных лишь крошечный фрагмент голоса этого человека. Он может даже имитировать различные эмоциональные состояния.
Многие из этих и десятки других проектов все еще находятся на стадии исследований. В любом из них нетрудно найти недостатки. Но путь от исследования к реальному миру будет быстрым, а найти недостатки станет исчезающе трудно.
У Apple, безусловно, есть инструменты для создания собственного генеративного чат-бота с искусственным интеллектом. Каждый новый Mac и iPhone имеет Neural Engine, способный обрабатывать до 15,8 триллион операций в секунду, а также мощные API Core ML и машинного обучения. Но мы не видим никаких движений внутри Купертино. Точность и скорость имеют первостепенное значение для чат-ботов с искусственным интеллектом — акции и доверие к Google упали на этой неделе после ошибки в чат-боте Bard — так что вполне возможно, что он работает за кулисами с Siri и в истинном стиле Apple не будет выпускать ничего, пока не будет совершенный. Но даже имея в своем распоряжении множество инструментов, остается вопрос: обращает ли Apple внимание?
Если Apple не будет внимательно следить за областью искусственного интеллекта, Apple может не осознавать, насколько быстро она развивается. Потребовался год, чтобы генеративный ИИ превратился из «дурацкой игрушки для онлайн-исследовательского проекта» в «дуэль объявлений от Microsoft и Google». Еще через два года эти инструменты будут в десять раз лучше, и их станет намного больше. Вам будет трудно сказать, что реально, а что полностью создано искусственным интеллектом из воздуха. Если у вас есть большие идеи, но ограниченные художественные навыки, генеративный ИИ значительно облегчит реализацию вашей мечты.

Чипы Apple M1 и M2 Mac имеют специальный нейронный движок, способный
мужчинау триллионов операций каждую секунду.
Яблоко
Благодаря Siri Apple была в авангарде внедрения голосового помощника с искусственным интеллектом в массы. По мере развития этой технологии Apple сильно отставала, и теперь Siri часто рассматривается как разочарование, которое не может сравниться с Google Assistant или Alexa. Когда дело доходит до генеративного ИИ, Apple даже не имеет преимущества первопроходца, как это было с Siri. Технологические компании, большие и малые, уже поставляют мощные инструменты. Без каких-либо действий Apple просто закончит производство некоторого оборудования, на котором будет работать наше будущее, основанное на генеративном искусственном интеллекте.
Не осознавая всю мощь этой новой технологии в собственном программном обеспечении и сервисах, Apple позволит всем остальным определять уровень техники для того, что может стать самым важным сдвигом в вычислительной технике за последние десятилетия. Возможно, компанию это устраивает, но по мере того, как продажи оборудования снижаются, а доля программного обеспечения и услуг в бизнесе Apple растет, она действительно не может позволить себе не быть лидером в революции генеративного ИИ.
Конечно, Apple — одна из самых скрытных компаний в сфере технологий, особенно когда речь идет о программном обеспечении. У Apple могут быть большие команды, которые усердно работают над внедрением генеративных функций ИИ в iMovie, Final Cut Pro, Logic Pro, Photos, Mail, Messages и весь пакет iWork. Все это можно полностью преобразовать с помощью мощных инструментов генеративного ИИ. Мы знаем, что около года назад Apple купила по крайней мере одну компанию, занимающуюся генеративным искусственным интеллектом, AI Music. Было бы разумно увидеть в продуктах Apple в этом году хотя бы инструмент «создать оригинальный мгновенный саундтрек для вашего видео».
Мы можем вообще ничего не услышать о генеративном ИИ от Apple, а потом на WWDC, БАМ! Генеративный ИИ мирового класса во всех продуктах Apple!
Я надеюсь, что это так, потому что, если Apple опоздает с такой трансформационной технологией, она обречет свое программное обеспечение на годы отставания от своих конкурентов на долгие годы.