Автор Тема: Нейросети, ИИ и всё, что с ними связано  (Прочитано 6180 раз)

wolfer и 3 Гостей просматривают эту тему.

Оффлайн Vlad666

  • Пользователь
  • Сообщений: 566
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #330 : Вчера в 22:37:37 »
Изучают алфавит.

Онлайн wolfer

  • Пользователь
  • Сообщений: 2510
  • Пол: Мужской
  • Mens sana in corpore sano
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #331 : Вчера в 22:43:31 »
Скорпион что-то замышляет

Оффлайн ShadowFlash

  • Пользователь
  • Сообщений: 2370
  • Пол: Мужской
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #332 : Вчера в 22:58:05 »
Как я уже сказал - сочинять и компилировать нейросети научились, хоть и криво. Но почему-то плохо справляются с простыми ответами на простой вопрос, где ответ - банальная фактическая информация. Например исторические даты, не являющиеся спорными, астрономические данные, которые не изменялись 60+ лет и прочее-прочее, что выдает любой поисковик или древняя мультимедийная энциклопедия на CD. 

И даже с распознаванием лиц, ради чего сейчас корпорации и государства так радостно используют нейросети часто всё не так уж весело. Например нейросеть спутала полутораметровую девочку-азиатку и двухметрового шестидесятилетнего бородатого негра. Ни малолетний ребенок, ни собака или кошка так облажаться не способны.

Или вот большие модели типа кодер на запрос "напиши клон Breakout (Pong, Tetris)" должны сразу выдавать полностью работоспособную игру в базовом варианте на основных языках программирования - то есть должны быть отработаны собственно запуск игры, игровой процесс, завершение игры, перезапуск, ввод имени при достижении рекорда, настройка уровня сложности, там где она есть в оригинальной игре.  Потому, что это всё является обычным компонентом обучения студентов и готовый код лежит в сети тоннами.  А когда огромная коммерческая модель, работающая на огромном кластере и за доступ к которой осуществляется за подписку не в состоянии сделать такие простые вещи, значит технология очень сырая и не совсем правильно развивается. Ибо правильное развитие - от базы к сложному.

Или вот музыкальные нейросети. Я тут расказывал про приемы защиты от ремиксов нейросетями. Оказывается, что если взять просто драм-машину, гитару и синтезатор (в данном случае Oberheim OB-X) и написать минутный трек с синтезаторным соло в духе Rush, то бедная нейросеть не в состоянии сделать на это ремикс, выдает жуткую какофонию. Просто когда в один момент встречается разрыв ритма ударных и достаточно сложное клавишное соло, плюс на фоне играет гитара и простой монотонный синтезаторный бас, этот гениальный ИИ путается в ритмах и мешает всё в кучу, путая инструменты, выбирая какие-то хаотичные звуки и ритмы, не имеющие ничего общего с исходными.

Хотя казалось бы - частоты разные, сонограмма вообще непохожа, даже пятилетний ребенок всё отделит как надо, да даже животное, способное чувствовать ритм. А у нейросети шизофрения наступает.

Еще смешнее, когда какая-нибудь заточенная под слабое железо модель весом в 5Гб с простыми вещами справляется лучше и выдает четкий ответ, а не изображает пьяного рекламщика или политика, выливая тонны воды и ошибаясь в фактах.

Оффлайн Zzmey

  • Пользователь
  • Сообщений: 319
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #333 : Вчера в 23:41:59 »
Запрашивал не я, правда или нет, не знаю :)

Оффлайн Vlad666

  • Пользователь
  • Сообщений: 566
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #334 : Сегодня в 07:26:18 »
Запрашивал не я, правда или нет, не знаю :)

У меня что-то обоз ИИ вообще не появляется при таком же запросе. Наверное, обновили. Смотри скрин ниже.

Добавлено позже:
Как я уже сказал - сочинять и компилировать нейросети научились, хоть и криво. Но почему-то плохо справляются с простыми ответами на простой вопрос, где ответ - банальная фактическая информация. Например исторические даты, не являющиеся спорными, астрономические данные, которые не изменялись 60+ лет и прочее-прочее, что выдает любой поисковик или древняя мультимедийная энциклопедия на CD.

Приведи пример такого запроса и ответ нейронки. Я не спорю, но хотелось бы проверить.

И даже с распознаванием лиц, ради чего сейчас корпорации и государства так радостно используют нейросети часто всё не так уж весело. Например нейросеть спутала полутораметровую девочку-азиатку и двухметрового шестидесятилетнего бородатого негра. Ни малолетний ребенок, ни собака или кошка так облажаться не способны.

Ну не знаю. Меня ChatGPT распознает, как давнего друга. Даже эмоции по лицу считывает безошибочно. А уличные камеры, подключенные к ИИ системе распознавания лиц, работают так, что фиг спрячешь лицо.

Или вот большие модели типа кодер на запрос "напиши клон Breakout (Pong, Tetris)" должны сразу выдавать полностью работоспособную игру в базовом варианте на основных языках программирования - то есть должны быть отработаны собственно запуск игры, игровой процесс, завершение игры, перезапуск, ввод имени при достижении рекорда, настройка уровня сложности, там где она есть в оригинальной игре.  Потому, что это всё является обычным компонентом обучения студентов и готовый код лежит в сети тоннами.  А когда огромная коммерческая модель, работающая на огромном кластере и за доступ к которой осуществляется за подписку не в состоянии сделать такие простые вещи, значит технология очень сырая и не совсем правильно развивается. Ибо правильное развитие - от базы к сложному.

Нейронка не имеет права создавать клоны. Даже если она технически может это сделать, она все равно не будет этого делать, чтобы потом на разработчика не подали в суд.

Еще смешнее, когда какая-нибудь заточенная под слабое железо модель весом в 5Гб с простыми вещами справляется лучше и выдает четкий ответ, а не изображает пьяного рекламщика или политика, выливая тонны воды и ошибаясь в фактах.

Это связано с тем, что локальная нейронка не загружена системными промтами разработчика. Чем больше системных команд, тем менее точной становится нейронка. Об этом уже где-то писалось.
« Последнее редактирование: Сегодня в 07:35:29 от Vlad666 »

Оффлайн ShadowFlash

  • Пользователь
  • Сообщений: 2370
  • Пол: Мужской
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #335 : Сегодня в 09:04:33 »
Даже если она технически может это сделать, она все равно не будет этого делать, чтобы потом на разработчика не подали в суд.

Только вот она делает. С одной проблемой  и вовсе не связанной с копирайтом. Код кривой выдает. Иногда может поправить сама если скопипастить сообщение об ошибке, чаще надо руками подгонять. И в 90% константы подгонять надо, чтобы не было проблем в механике. Например хард дроп в тетрисе 80% нейросетей делают так, что при нажатии на кнопку там получается автоповтор со страшной скоростью, то есть игра просто ломается. 

И что касается Breakout или Arkanoid, и того же тетриса - еще с 80ых клонов этих тысячи. И никаких юридических проблем ни разу не было.

Например Batty на спектруме - это разве не Арканоид почти 1 в 1 по механике? Вот называть игру как оригинал - тут проблемы могут быть, особенно в случае последующей продажи. Не говоря уже о том, что все вообще страны мира, в которых было хоть какое-то производство электроники в 70ые-80ые клепали понг-консоли. Сотни фирм и моделей. На всем известной микросхеме или же на рассыпухе. Просто называли там Video Tennis или что-нибудь спорт. И всё.

Оффлайн Zzmey

  • Пользователь
  • Сообщений: 319
    • Просмотр профиля
Нейросети, ИИ и всё, что с ними связано
« Ответ #336 : Сегодня в 09:04:47 »
Справедливости ради, основные супер инструменты, они локальные и не занимают много места.
1) гугл камера с переводчиком - работает оффлайн, размер словаря около 100мб.
2) распознавание нот - оффлайн приложение - роботы поют многоголосным пением на русском. Размер тоже несколько десятков мб.
3) текст в речь - в плохом качестве встраивают везде давно, размер тоже мб около 10 наверное. В читалках книг например, в виндоуз встроен вроде бы какой то спич.
4) распознавание речи - было встроено в мой первый телефон Нокиа 3310,  :lol: а если серьёзно, сейчас не знаю, речь в текст какие ресурсы в современном виде использует.
5) картинка в текст - Промт, раньше весил много гигабайт там или сколько, но тоже все локально.