Разработка и ромхакинг > Программирование
Адекватность написания скрипта на Python.
(1/1)
Томахомэ:
Задался я, значить, задачей создать с нуля нейросеть-реставратор аудио. Поскольку сам за Питон не шарю, а "змееводы" и нейроинженеры на дороге не валяются, запросил помощи у Grok'а, который у меня лично хорошо зарекомендовал себя своим умением довольно доходчиво объяснять смысл кода на это раз уже на старых добрых C и M68k ASM, и даже выдавать на них вполне осмысленные строки - понадеялся я на то, что с Питоном он ладит хотя бы примерно так же.
Запрошенный мной скрипт audio_autoencoder.py должен, вроде как, по логике вещей, обучать модель AuRec на сравнении "нормального" звукового файла и его искусственно пошакаленной версии. В качестве "аттестата зрелости" для AuRec я выбрал stage2.wav - рип одного из музыкальных треков игры Gaia: The Last Choice of Earth (во многом, кстати, именно по этой причине я пошёл, получив глухую тишину в аналогичной теме на GcUp, спрашивать следом сюда), где вся музыка существует только в виде угрёбищнейших ADPCM-сэмплов с частотой дискретизации 6060,(60). И если бы AuRec заставила бы его звучать прилично - это однозначно свидетельствовало бы, что она как нейрореставратор состоялась.
Однако, сколько бы материала для обучения я ей не подкидывал, при каждом применении скрипта apply_audio_autoencoder.py файл stage2_recover.wav всё так же один хрен мало того, что выдаёт какой-то шум, в котором исходник не узнаётся вообще, так ещё и короче последнего в несколько раз.

Так вот, самая суть вопроса - хоть audio_autoencoder.py с apply_audio_autoencoder.py и производят впечатление конвенционально рабочих инструментов, не нуждаются ли они в обширных правках уже человеческими руками, и не генерят ли они просто-напросто мусор вместо того, чтобы обучать модель и применять её?
Ogr:
Е***ь ты нашёл на каком ресурсе спросить про разработку нейросетей… ты ещё сходи в хлебный и поинтересуйся про технологию обогащения урана. :lol:
wolfer:
Томахомэ, я, конечно, за разработку, может, и не шарю по мнению некоторых, но выглядит так, что ты одного заставил наговнокодить, а других пытаешься заставить выполнить код ревью. Мой тебе совет, изучи азы питона, прочитай пару книжек про МЛ, а не вываливай на всех свои хотелки. Твоего участия не видно, ферштейн? :)
Ogr:
Логика подсказывает, что в тысячу крат больше шансов получить ответы на подобные вопросы в дискорде https://huggingface.co
Томахомэ:

--- Цитата: wolfer от 08 Июнь 2025, 11:17:02 ---Томахомэ, я, конечно, за разработку, может, и не шарю по мнению некоторых, но выглядит так, что ты одного заставил наговнокодить, а других пытаешься заставить выполнить код ревью. Мой тебе совет, изучи азы питона, прочитай пару книжек про МЛ, а не вываливай на всех свои хотелки. Твоего участия не видно, ферштейн? :)

--- Конец цитаты ---

А его и нет - я тут выступал чисто заказчиком, если такой термин применим к неоплачиваемой услуге. Причём заставить Grok выдать скрипт, который не вылетал бы с ошибкой удалось далеко не с первой и даже не с 10-й попытки. Самое при этом смешное, что когда я кидал ему содержимое очередного сообщения об ошибке, он вроде как даже с лёту прочухивал, в чём дело и исправлял, однако то ли исправлял их строго по одной за запрос, то ли плодил новые.
wolfer:
Томахомэ, нельзя не понимая, что как работает, заставить нейронки выдать готовый продукт. Пока что. Иначе все мои знакомые с зп 500+ уже на улице бы в коробках жили :)
SegaMark:
Я так понял задача в том чтобы извлечь музыку из одной игры, сжать ее, импортировать в другую игру. Но видимо у тебя при сжатии появляется шипение и ты хочешь нейронку заставить корректировать данный файл чтобы звучало по лучше. Так может тогда лучше попросить GROK чтоб он написал конвертер, который сразу конвертирует звук в тот который захочешь. И не совсем понятно, получится ли импортировать уже корректный звук в игру.
Томахомэ:

--- Цитата: SegaMark от 09 Июнь 2025, 08:08:10 ---Я так понял задача в том чтобы извлечь музыку из одной игры, сжать ее, импортировать в другую игру. Но видимо у тебя при сжатии появляется шипение и ты хочешь нейронку заставить корректировать данный файл чтобы звучало по лучше. Так может тогда лучше попросить GROK чтоб он написал конвертер, который сразу конвертирует звук в тот который захочешь. И не совсем понятно, получится ли импортировать уже корректный звук в игру.

--- Конец цитаты ---

Нееее, не сжать. Я исходный трек, наоборот, разжал из ADPCM-формата, преобразовав в стандартный VAW-файл. И это, если что, уже не для Operation Fireweb, а для другого проекта.
SegaMark:
Можешь тогда бинарные данные скинуть, которые надо разжать, может кто-то уже делал что то подобное или хочет попробовать и у него получиться. А нейросеть это конечно круто, но мне кажется в данном случае это излишне, лучше попросить нейросеть чтобы она помогла разжать данные.
Томахомэ:

--- Цитата: SegaMark от 09 Июнь 2025, 12:29:49 ---Можешь тогда бинарные данные скинуть, которые надо разжать, может кто-то уже делал что то подобное или хочет попробовать и у него получиться. А нейросеть это конечно круто, но мне кажется в данном случае это излишне, лучше попросить нейросеть чтобы она помогла разжать данные.

--- Конец цитаты ---

"Разжать" - это скорей условно. Просто открываешь в Audacity: "Импорт -> Raw данных", затем выбираешь VOX ADPCM (моно) и выставляешь его "родную" частоту дискретизации 6061 Гц (естественно, что с такого днища без нейротеха качество не поднять). Когда откроется, выбирай "Экспорт -> Экспорт на компьютер".
Навигация
Главная страница сообщений

Перейти к полной версии