| Разработка и ромхакинг > Ромхакинг и программирование |
| Алгоритмы сжатия информации |
| (1/3) > >> |
| sergi:
Занимаюсь написанием своих программ под приставочное железо, но столкнулся с проблемой имеется пространство в 1 мегабайт, а нужно уместить данных на 2 мегабайта но данные имеют свойство повторяться или быть очень похожими вот примерда видно что 0 повторяются, но избавление от них в общей массе дает процентов 20% сжатия, нужно 50% может кто знает и посоветует метод и алгоритм его реализации? желательно для M68K ну в сеге там разные бывают алгоритмы сжатия графики - вот ченить из этой серии бы мне :? |
| Йобан Матич:
Можно скомбинировать пару методов: нули пожать с помощью RLE, остальное хаффманом или LZx. |
| sergi:
А ченить типа примера как это реализовать нет? :? Вот еще такие данные|
| lupus:
http://shedevr.org.ru/forum/viewtopic.php?t=3590 - хорошая дока по алгоритмам |
| Йобан Матич:
http://ru.wikipedia.org/wiki/Код_Хаффмана http://ru.wikipedia.org/wiki/LZW =) sergi, тебе в ROM или в RAM надо затолкать 2Мб ? |
| sergi:
Ну это из ром брать и в рам засовывать нужно кусками по 8 килобайт т.е. в реале каждые 8 килобайт пожать до 4-х просто в роме места на метр, а данных нужно метра на 2 засунуть незапакованных, но есть несколько тысяч свободных тактов процессора, поэтому ищу распаковщик ибо запихать без запаковки очень сложно и много места потребует |
| Йобан Матич:
sergi, Почему именно метр, хак делаешь? Если SEGA, то может поковыряешь "Street Fighter" пятиметровый, может получится побольше места раздобыть =) |
| sergi:
Это не для сеги и не хак делаю, свой код пишу просто с 0, ну подспутно изучаю как там что пишу в асме цифрами в хексе, поэтому конечно бы всего этого исходник иметь в асме ну в общем я почитаю конечно, но может кто уже реально с этим сталкивался и есть типа опытных образцов? в стрит файтере маппер стоит, перелопатьте ром в обычных но без маппера и без некоторых бойцов и все будет работать ;) хотя игра чистый отстой SF2 Turbo на SNES лучше :-\ |
| HoRRoR:
Используй LZ + Huffman сверху. Для случаев, когда мало повторяющихся цепочек - просто хаффман. --- Цитата ---пишу в асме цифрами в хексе --- Конец цитаты --- Сам себе компилятор, что ли? о_О |
| sergi:
Так мне проще понимать суть вещей я пытался конечно с компиляторами возиться, но получалось так что то что я хотел он не всегда видел а самому проще, я еще и дизасемблер заодно просто код перекидываю из цифр в буквы мнемоники даже свои сделал, ну точнее они немного полнее описывают что куда и откуда ложиться есть еще сводные таблицы опкодов для M68K и Z80 собственно я думал уже над тем что врядли в приставках и играх используют все комманды процессора, с учетом того что основное это взять чтото и положить тудато ну прибавить, отнять - вот основные коды и помогают, остальные просто не нужны, по крайней мере мне в общем нужно попробовать конечно мне сделать эти типы сжатия одно только еще интересно что zip жмет как раз гдето в 2 раза это дело, поэтому есть к чему стремиться ^_^ |
| HoRRoR:
Чувак, это путь в могилу. Разберись уж лучше с копмиляторами. И не надо придумывать своих мнемоник - те, что есть, не зря такие, они были очень хорошо продуманы. |
| Smoke:
sergi, RNC не пробовал? |
| GManiac:
Хотел сказать RNC, пока читал тему, но полдня не мог зайти на форум :( sergi, посмотри RNC, в инете есть паковщик под PC и процедуры распаковки для разных процев, т.ч. для 68-ки - в играх он и используется. Т.к. есть и паковщик и процедуры распаковки, тебе в общем-то не надо будет копать алгоритм. Я разбирал процедуру распаковки и выяснил, что RNC - это LZ + Хаффман для кодирования ДЛИН указателей. Он достаточно быстрый. Если им не сможешь запихнуть свои 2 метра в 1, то с более сильными алгоритмами 68K вряд ли справится. |
| sergi:
В общем принцип любого сжатия информации заключается в том, чтобы повторяющиеся данные, заменить меньшим числом данных, а также данные встречающиеся по определенному закону тоже заменить на некоторое количество данных описывающих этот закон проблема в том что если буквально это будут разнобойные тупо разные байты идущие в разных порядках и не будут повторятся, то сжатия не будет никакого - некуда просто |
| HoRRoR:
--- Цитата: sergi от 29 Апрель 2009, 18:46:20 ---проблема в том что если буквально это будут разнобойные тупо разные байты идущие в разных порядках и не будут повторятся, то сжатия не будет никакого - некуда просто --- Конец цитаты --- Не все данные имеет смысл сжимать. |
| sergi:
Ну эти смысл конечно есть и нужно в общем такой вариант есть и крутится в голове у меня не более 512 разновидноестей 2-х байтовых цепочек на 8 килобайт поэтому обозначу каждую не 16 битами как они есть а всего лишь 9-ю 0x0000 обозначу как 000000000b и тогда буду восстанавливать данные так если 000000000b значит это начало, далее все как обычно но в соответствии с таблицей соответствия и последние нули учитывать не буду, т.к. они по умолчанию в памяти будут, а новые 9 нулей обозначат новую линию данных - там в общем по 16 2-х байтовых цепочек на линию таким образом получится что освобождение от нулей даст процентов 20% сжатия а 9 бит вместо 16 дадут соответственно гдето около 44% сжатия, получится в лучшем случае даже 64% на выходе, в худшем 44% так будет в среднем 50% от исходного кода не знаю как это будет называться. но чегото типа RLE+LZ77 :? В принципе в начале каждой такой сборки по 8 килобайт, можно еще писать цифру допустим 9 значит 9 бит на сцепку по 2 байта ну и так от 0 до 16 т.е. 16 это и так понятно - оно и есть, можно не корячится зато если допустим там только 0 и несколько значений всего, допустим 4 или 5, то соответственно можно и 2-3 бита на сцепку по 2 байта взять и указать в начале байтом т.е. соответственно 02 или 03 если всего 256 оригинальных значений по 2 байта, то вообще 1 байтом менять, получится сжатие в 2 раза сместа в общем я думаю если кому нужно то соответственно понятно расписано, хотя все это и так знают В начале этих 8 килобайт должна быть такая инфа: 1 байт - сколько бит на сцепку по 2 байта 2 байта - сколько вообще оригинальных сцепок сами сцепки по порядку начиная с 0000 обозначенная 000000000b и далее сколько их там будет по возрастанию( это будет в максимуме 512 по 2 байта = 1 килобайт) а далее уже ужатая инфа по 9 бит, размер собственно четко обозначен |
| GManiac:
Ну у тебя есть 9 бит вместо 16, а нужно 8, т.е. ужимать нужно не очень сильно. Отсюда и надо плясать. Подойдёт нечто Хаффманоподобное и таблица 512*2 байта. |
| sergi:
Ну сложнее алгоритм пока мне не нужно, а то т.к. в асме для M68K пишу, сложнее мне сложно будет придумать и сделать, тут вроде можно просто через память и регистры перекинуть, ну по сдвигать придется конечно если брать по 72 байта чтоли получится брать нужно будет, ну там посмотрим на результат и на скорость выполнения его сложнее и компактнее наверняка можно, но нужно ли еще вопрос :-\ |
| GManiac:
Но ужимать всё равно придётся, т.к.9 бит больше 8. Короче, давай пример 8-кбайтового куска и таблицу 512*2, посмотрим. |
| sergi:
Ну больше, так больше 9 бит может быть кратным 8 при числе 72 т.е. берем 9 байт и там будет 8 наших уникальных идетнификаторов сцепок т.е. брать нужно по 9 байт из этих 8 килобайт последовательно и вытягивать потихоньку Вот сами 8 килобайт, ну там немножко меньше даже выборки уникальных пока нет - позже сделаю|
| Навигация |
| Главная страница сообщений |
| Следующая страница |