Многие полагаются на Gemini, ChatGPT или Grok, чтобы использовать больше возможностей в одном приложении, но они по-прежнему испытывают трудности с такими задачами, как интеллектуальное масштабирование.

  • Чат-боты на основе искусственного интеллекта становятся все более мощными.
  • Они уже позволяют редактировать изображения, но со своими ограничениями.
  • Будущее многообещающее.

Искусственный интеллект «Джемини» пытается масштабировать изображение

La Искусственный интеллект Это то, что, если вы назовёте «модой», нельзя отрицать, что это не временное и не кратковременное явление. Мы говорим об этом уже как минимум три года, и, по сути, Не выходите за рамки машинного обучения и переходите на следующий уровень. Это нисколько не снижает ажиотажа. Как это обычно бывает, различные СМИ не упускают возможности опубликовать что-то новое на эту тему, как показывает эта статья.

Дело в том, что в последнее время появилось немало авторов блогов, которые утверждают, что Они используют все меньше приложений и все больше полагаются на чат-ботов. искусственного интеллекта как Gemini, ChatGPT или Grok. И, в общем-то, они отчасти правы. Не обижайтесь, если это прочитает редактор, который сказал, что они использовали ИИ-калькулятор, но мне кажется, что это немного перебор: можно выполнять вычисления напрямую с помощью голоса Siri или Google Assistant, даже не разблокируя экран. Если только он не имел в виду именно это, в таком случае я согласен.Но мы должны быть честны и сказать, что они не все делают хорошо, и даже близко не подходят к этому.

Редактирование изображений — да, масштабирование — нет. По крайней мере, с ИИ в чате.

Это была последняя статья о замене приложений искусственным интеллектом, не помню какая, которая заставила меня подумать: «Попробую масштабировать изображения». Обычно я использую Upscayl, мое предпочтение перед Upscaler Потому что в KDE он выглядит лучше. Иногда я замечаю, что проект публикует примечание к выпуску с изображением шириной около 600 пикселей, а сейчас в блоге Actualidad мы используем изображения размером 1200 пикселей. Если я загружу исходное изображение, WordPress просто увеличит его, и оно будет выглядеть немного размытым.

Поэтому я использую программу, которая увеличивает размер с небольшой потерей качества, и обычно получаю приличные результаты.

Проблема в том, что это приложение использует Electron, и мне приходится использовать его AppImage, который мне не нравится, или устанавливать версию AUR, которая также устанавливает тот самый Electron, который мне не нужен. Именно эти камешки в ботинке побудили меня попробовать Gemini, который сейчас в новостях. Нано Банан.

Что делает Gemini Nano Banana?

Nano Banana может показывать впечатляющие результаты, но переговоры, чтобы добиться нужного нам монтажа, порой бывают мучительными. Часто он делает всё правильно с первого раза, но чаще — нет, и когда мы просим его смонтировать первое, что придёт в голову... это порой больше похоже на искусственную глупость, чем на искусственный интеллект.

В моём тесте, который я также использовал в ChatGPT и Grok, я сделал скриншот рабочего стола, уменьшил его до 400 пикселей в ширину и спросил, можно ли изменить размер. Когда он ответил утвердительно, я сказал, что ему придётся проанализировать изображение и попытаться вернуть его в том же размере, но с минимальной шириной 1200 пикселей. Самое забавное, что он подумал, что было бы неплохо добавить значок корзины Windows в левый верхний угол, но не так уж и смешно, что он не понял, о чём я говорю: увеличить размер без потери качества. Он просто увеличил его, как мы делаем с Gwenview, оставив всё размытым (и с этой корзиной).

Я получил тот же результат с Grok и ChatGPT, и в тот момент я начал думать о других моделях искусственного интеллекта, таких как Легкая диффузияЭто было как раз перед тем, как я об этом подумал и понял, какую глупую идею я затеял: если я не собираюсь использовать чат-бота и мне нужно найти альтернативу, почему бы мне не использовать тот же, которым я пользуюсь сейчас (Upscayl)?

Искусственный интеллект (машинное обучение, кхм) будет продолжать совершенствоваться

Итак, да, мы можем забыть о многих приложениях и сделать то же самое с чат-ботами на основе искусственного интеллекта, но они должны продолжать совершенствоваться, чтобы уверенно справляться с большим количеством задач. В среднесрочной перспективе мы будем решать с их помощью многие задачи, но пройдёт ещё немало времени, прежде чем мы забудем о том, что УЖЕ работает.