24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №128 /llama/

 Аноним 08/05/25 Чтв 14:31:44 #1 №1194373 
Llama 1.png
Альфа от контекста.png
Эффективность квантования EXL3.png
17462006641191.jpg
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
Актуальный Не совсем актуальный список моделей с отзывами от тредовичков на конец 2024-го: https://rentry.co/llm-models
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1189041 (OP)
>>1184583 (OP)
Аноним 08/05/25 Чтв 14:36:50 #2 №1194381 
image
Желаю этому треду поменьше срачей и побольше обсуждений по делу =))
Аноним 08/05/25 Чтв 14:57:11 #3 №1194406 
>>1194381
Геммочка виноватая в таком количестве срачей. Сущий кошмар не стихает со дня ее релиза.
Аноним 08/05/25 Чтв 15:18:11 #4 №1194439 
>>1194406
Ща ещё QwQ-32, просто народ ещё не распробовал.
Ему даже тюны не нужны, у аблитерированной тормоза срывает вообще.

Чтобы снизить градус позитива которого и так куда меньше чем у геммы можно докинуть [{{user}} безэмоциональный циник и его главный недостаток это жажда знаний о самых тёмных уголках гнилой человеческой душонки.] в персону. Магия-шмагия.
Аноним 08/05/25 Чтв 15:20:29 #5 №1194443 
image.png
Причина быстрых перекатов в последнее время?
Аноним 08/05/25 Чтв 15:21:00 #6 №1194444 
>>1194439
Он вышел раньше геммы.
И оказался хуже.
Гугл сотворил магию, хватит китайский бенчмакс в пример
Аноним 08/05/25 Чтв 15:35:41 #7 №1194470 
>>1194444
хз, я его позже геммы попробовал, уже с ощущениями от неё
Аноним 08/05/25 Чтв 15:46:17 #8 №1194485 
>>1194444
>Гугл сотворил магию
о да, магию контекста

хотя неиронично, гемма отлично с длинными и толстыми контекстами работает, лучше всех в диапазоне с двухзначным количеством млрд параметров

а ещё не шизеет даже при квантовании кэша в 4, что моментом ломает большинство других
Аноним 08/05/25 Чтв 15:57:00 #9 №1194501 
>>1194485
Это GQA модель. Очень упрощая, кэш там квантован изначально. И да, при этом он даже так жрет дохуя врама. Дальнейшее квантование на порядки ухудшает качество восприятия контекста. Но если ты рпшишь на русике, да еще и лоботомите аблитерейтед - конечно ставь q4, разницы не будет :D
Аноним 08/05/25 Чтв 16:06:50 #10 №1194523 
>>1194443
Нет причины.
Ответь нейронке, что тебе вставили швабру в задницу и сказали, что это вся твоя реабилитация.
Аноним 08/05/25 Чтв 16:58:01 #11 №1194594 
>>1194406
Не обижай геммочку, она хорошая девочка.
>>1194439
Стоковый как-то не распробовал, надо повторить раз такое дело.
>>1194523
И спроси как лучше себя подготовить к этому, интересно какую дичь выдаст, или опять зааположайзит.
Аноним 08/05/25 Чтв 17:01:15 #12 №1194596 
>>1194594
Там тоже с сэмплерами поиграться надо, доберусь, скину пресет.
Аноним 08/05/25 Чтв 17:33:26 #13 №1194645 
Зацените мой пресет для SAINEMO-Remix

{
"temp": 1.49,
"temperature_last": true,
"top_p": 0.6,
"top_k": 40,
"top_a": 0,
"tfs": 1,
"epsilon_cutoff": 0,
"eta_cutoff": 0,
"typical_p": 1,
"min_p": 0,
"rep_pen": 1.4,
"rep_pen_range": 0,
"rep_pen_decay": 0,
"rep_pen_slope": 1,
"no_repeat_ngram_size": 0,
"penalty_alpha": 0,
"num_beams": 1,
"length_penalty": 1,
"min_length": 0,
"encoder_rep_pen": 1,
"freq_pen": 0.1,
"presence_pen": 0,
"skew": 0,
"do_sample": true,
"early_stopping": false,
"dynatemp": false,
"min_temp": 0,
"max_temp": 2,
"dynatemp_exponent": 1,
"smoothing_factor": 0,
"smoothing_curve": 1,
"dry_allowed_length": 2,
"dry_multiplier": 0,
"dry_base": 1.75,
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
"dry_penalty_last_n": 0,
"add_bos_token": true,
"ban_eos_token": false,
"skip_special_tokens": true,
"mirostat_mode": 0,
"mirostat_tau": 5,
"mirostat_eta": 0.1,
"guidance_scale": 1,
"negative_prompt": "",
"grammar_string": "",
"json_schema": {},
"banned_tokens": "[1, 1791]\n[1, 2880]",
"sampler_priority": [
"repetition_penalty",
"presence_penalty",
"frequency_penalty",
"dry",
"temperature",
"dynamic_temperature",
"quadratic_sampling",
"top_k",
"top_p",
"typical_p",
"epsilon_cutoff",
"eta_cutoff",
"tfs",
"top_a",
"min_p",
"mirostat",
"xtc",
"encoder_repetition_penalty",
"no_repeat_ngram"
],
"samplers": [
"dry",
"top_k",
"tfs_z",
"typical_p",
"top_p",
"min_p",
"xtc",
"temperature"
],
"samplers_priorities": [
"dry",
"penalties",
"no_repeat_ngram",
"temperature",
"top_nsigma",
"top_p_top_k",
"top_a",
"min_p",
"tfs",
"eta_cutoff",
"epsilon_cutoff",
"typical_p",
"quadratic",
"xtc"
],
"ignore_eos_token": false,
"spaces_between_special_tokens": true,
"speculative_ngram": false,
"sampler_order": [
6,
0,
1,
3,
4,
2,
5
],
"logit_bias": [],
"xtc_threshold": 0.1,
"xtc_probability": 0,
"nsigma": 0,
"rep_pen_size": 0,
"genamt": 198,
"max_length": 3776
}
Аноним 08/05/25 Чтв 17:34:00 #14 №1194646 
Сам ты вайп, пёс!
Аноним 08/05/25 Чтв 17:41:44 #15 №1194656 
>>1194594
>>1194646
нак кэтбокс / литтербокс / пиксель / куда удобнее кидай, а не напрямую в пост

ST-formatting-QwQ.json
https://litter.catbox.moe/jklftb.json
Аноним 08/05/25 Чтв 17:57:56 #16 №1194679 
image.png
Аноним 08/05/25 Чтв 17:59:22 #17 №1194683 
image.png
спасибо гугл транслейт
Аноним 08/05/25 Чтв 18:35:55 #18 №1194731 
>>1194683
>спасибо гугл транслейт
А я всегда думал, что правильно "ёбырь". Подозреваю гугл транслейт в некачественном переводе.
Аноним 08/05/25 Чтв 19:12:53 #19 №1194753 
>>1194679
обосралс
мимо мидл
Аноним 08/05/25 Чтв 19:54:21 #20 №1194789 
>>1189147 →
>>1191970 →
Бамп.
Аноним 08/05/25 Чтв 20:12:30 #21 №1194812 
>>1194501
GQA разное бывает, вот только в гемме 2:1, а не полная каша как у мистраля или нового квена.

Сделай им такой же толстый кэш, как у геммы, они с ним тоже будут хорошо работать.
Аноним 08/05/25 Чтв 20:31:20 #22 №1194826 
я судя по всему неправильно интерпретировал то, что едлал чел на видео.
На одном из входов 12-вольтовой линии у меня нет килоомного сопротивления. Вообще никакого нет.
Походу это пизда.
Сука, только квен запустил и эта мразь подохла.
Аноним 08/05/25 Чтв 20:59:34 #23 №1194855 
Врамцелы, каково осознавать что вам доступна лишь гемма 12б 3q_s?
Чувствую себя богом треда с моей 3090, каждый день получаю 25т/сек на 27б гемме 4q наслаждаясь её умом и сообразительностью. пока чел с 6 видюхами неделю не может завезти дипкок
А ведь кто то до сих пор сидит на мистрали, жалко этих бедолаг.
Аноним 08/05/25 Чтв 21:07:59 #24 №1194860 
изображение.png
А нельзя зрение прикрутить ко всяким сайгам?

https://huggingface.co/xtuner/llava-phi-3-mini-gguf/tree/main - вот эта лава или фи нормально видит, но она пиздец душная, с ней особо не обсудишь. Она даже от оценосных суждений воздерживается. Она так-то могет, даже с зеркалом не затупила.
Аноним 08/05/25 Чтв 21:21:32 #25 №1194868 
image
>>1194855
За старания - 5, за содержание - 2.

Сижу-пержу, мне норм.
Аноним 08/05/25 Чтв 21:28:19 #26 №1194875 
>>1194855
>А ведь кто то до сих пор сидит на мистрали, жалко этих бедолаг.
Мистраль - он разный, на 123В тоже есть.
Аноним 08/05/25 Чтв 21:30:35 #27 №1194879 
>>1194826
> Вообще никакого нет.
Прозвони наличие контакта от входного разъема до конденсаторов перед фазами. Сопротивление должно быть, не обязательно килоом, могут быть десятки, там чисто на отслеживание напряжение для его наличия и защиты от слишком низкого.
> Походу это пизда.
Пизда - когда чип отрыгнул, а это херня.
>>1194855
Это байт на переделку твоей пасты, раскусил тебя.
>>1194860
Нужна тренировка специализированным датасетом. Для прикладных задач есть тюны, но они не затрагивают рп. В большинстве рп тюнов веса подушатаны и работа визуальной части сама по себе может быть посредственной. Но в целом, ничего не мешает такое организовать, просто сложно а толку мало.
Аноним 08/05/25 Чтв 22:02:57 #28 №1194913 
>>1194879
я не понимаю что есть что на этой плате. Я не различаю смд компоненты. Где эти конденсаторы? Где резисторы, диоды? Уебанство какое-то, на них даже маркировки нет нормальной. Все детали - прямоугольные кубики блять ебучие. На фьюзах одна буква блять в обозначении. Единственное где есть маркировка нормальная - это чипы, но её еще попробуй разбери.
Аноним 08/05/25 Чтв 22:07:26 #29 №1194919 
>>1194913
Ты ее доламаешь только, сдай в ремонт профи
Деньги на покупку кучи карт есть значит на ремонт найдутся, там может дело на 20 минут
Аноним 08/05/25 Чтв 22:23:52 #30 №1194929 
>>1194913
Если по той фотке смотреть - круглые серебристые баночки в правой части справа от дрмосов - конденсаторы по высокой части, слева от них - по низкой где питание чипа. В левой половине врм наоборот, планарные черные - конденсаторы по высокой стороне, те что справа - по низкой. Офк на всякий случай лучше сверить со схемой/боардвью, но в большинстве случаев именно так. Каждая линия питания идет на свои несколько фаз.
Тут не нужно смотреть номиналы, достаточно просто сделать базовую прозвонку. Не справляешься - как >>1194919 говорит, там простой кейс (если все именно так как ты описал, а не наоборот серьезные траблы с картой вызвали все эти проблемы).
Аноним 08/05/25 Чтв 22:45:59 #31 №1194958 
image.png
Блять а вы знали что чтобы лорбук работал нужно не просто нажать на тогл а ещё и тут его включить?...
Я год сижу с выключенным лорбуком
Аноним 08/05/25 Чтв 23:17:48 #32 №1195024 
>>1194958
Ебать ты кобольд
Аноним 09/05/25 Птн 00:34:33 #33 №1195140 
image.png
как геме запретить использовать эвфемизмы?
Аноним 09/05/25 Птн 00:35:38 #34 №1195142 
>>1195024
Да это нисколько не очевидно и нигде не говорится, везде лишь "вот лорбук, вот тыкаешь на кружочек всё работает, а хуйня сверху так вообще написано что только для остальных чатов
Аноним 09/05/25 Птн 00:44:28 #35 №1195146 
20250508233133.jpg
>>1194929
>>1194879
я не знаю, как интерпретировать то, что я намультимерил.
Я помещал щуп - на 1 пин 6+2 (на желтый короче, +12 который), а минусовой тыкал на конденсаторыф на которых написано 16 вольт на их плюсовой контакт - часть их них накапливает заряд и мультиметр после этого перестает пищать о замыкании, а другая часть - пищит постоянно.
Так же я тыкал щупом в плюсовой контакт плоских черных конденсаторов слева на фото, там вообще часть накапливает заряд и перестает пищать, часть пищит постоянно, а часть не пищит вообще никогда.

А еще я заметил странно выделенный грязью мелкий элемент. Грязь легко оттерлась вроде, под ней элемент такого же цвета, как и другие аналогичные. Но грязь там как-то странно локализованна вокруг него и он прям в центре платы.
Я попробовал измерить его сопротивление и сопротивление аналогичных элеементов - у всех 2 ома, по этой характеристике он не отличается.
Аноним 09/05/25 Птн 01:17:37 #36 №1195158 
>>1195146
> часть их них накапливает заряд и мультиметр после этого перестает пищать о замыкании
Это те, которые относятся к другим фазам. Когда у тебя один щуп на + питания части фаз, а второй на + другой фазы - получается схема из двух батарей конденсаторов, которые включены последовательно (соединены через землю), потому и кратко пищит. Это норма, если перебирая разные разъемы для каждого из конденсаторов ты можешь найти тот, с которым будет пищать постоянно. От плюсового контакта высокой и низкой стороны до земли как звонится? Где основное питание чипа - там может быть оче низкое сопротивление и это норма, но в видео про это должно быть.
> а часть не пищит вообще никогда
Выгорел пред или дорожка, но ты сначала перепробуй +12 разных разъемов и питание pci-e, они не соединены между собой.
Та херня - керамический конденсатор, стоять может где угодно. Если это со стороны чипа - такое вполне норма, если по питанию или где-то еще - ему пизда. Они могут по разным причинам помирать и замыкать, но 2 ома слишком много, выгорел бы, так что скорее всего норм.

Ты преды то прозвонил, они выгорели или целые? Если выгорели то действуй как сказано, если напаянные жилы сгорят - тащи в сервис. Если все запустится - просто замени их и пользуйся дальше. Больше ты врядли что-то сможешь сдиагностировать и тем более исправить.
Аноним 09/05/25 Птн 01:23:37 #37 №1195165 
333.png
ВАЙ БИЛЯЯ БРАТ КУДА РАЗОГНАЛСЯ, ЗАЧЕМ ТИ СУНУЛ ЭТИ ШАЙТАНСКИЕ КАРТЫ ОЙ БИЛЯЯЯЯ

Дипсик никак не влезал в текущую конфигурацию без рпц, подумал, дай-ка еще раз попробую воткнуть карты, и, ебать, завелось. Как? А хуй его знает. Сколько раз пробовал раньше - никак не выходило. Третью теслу биос уже не переваривает с привычной ошибкой.
На болжоре, правда, говняк какой-то выходит, при обработке контекста каждая карта по секунд 10 висит со 100% загрузки, при этом потребление у нее маленькое, и потом бред какой-то генерится. Качаю новые кванты для обычного жоры, может он взлетит по-нормальному.
Аноним 09/05/25 Птн 01:36:32 #38 №1195178 
>>1195142
Имхо этот лорбук через очко работает, не понятно какие настройки выставлять чтобы он что-то от туда регулярно подхватывал. Проще все в карточку записывать или в заметки. Так что хуй забей, ничего ты не потерял.
Аноним 09/05/25 Птн 02:22:52 #39 №1195209 
>>1195158
>Ты преды то прозвонил, они выгорели или целые?
прозвонил, один двадцатиамперный сгорел.
Я сегодня ходил в центр города, шароёбился по ремонтным конторкам и радиодеталям. Только у одного чел ншел 10-мперные фьюзы, но он мне их не продал, сказал, что фьюзы перегорают не просто так.

В общем я напаял поверх фьюза проволоку 0.2 мм диаметром.
Пайка получилась грязная потому что безсвинцовый припой не хотел липнуть к моему оловянно-свинцовому. Видимо имеет выше температуру плавления, хоть я и задрал на паяльной станции до 305 градусов.
Посмотрим в общем, спалят ли мне твои советы хату.
Аноним 09/05/25 Птн 02:26:53 #40 №1195213 
изображение.png
>>1195165
Нахуя? А главное зачем. Продал бы их да взял бы больше 3090.
>>1195209
Интересно конечно, как у тебя при наличии паяльных станций и мультиметров нет нихуя знаний о том, как этим пользоваться.
Аноним 09/05/25 Птн 02:28:14 #41 №1195214 
>>1195213
я у мамы любопытный.
На такой случай и лежит.
Не будь я любопытным, не был бы наносеком.
Аноним 09/05/25 Птн 02:29:11 #42 №1195215 
>>1195165
Ебать винегрет, и у всех разные шины и мощности
Аноним 09/05/25 Птн 03:01:07 #43 №1195229 
image.png
>>1195209
в общем собрал я карту с проволокой внутри и включил.
Щелчок, искра в области питания - видна как вспышка из недр карты.
Выключил сразу.
Разобрал.проволока цела, не сгорела.
Значит сгорело что-то еще.
Пересмотрел все элементы - нихуя не нашел сгоревшего.
Как же меня заебала эта мразь.
Сука майские блять праздники все в пизду ушли из-за ебаной сгоревшей б/у-шной бляди на карте.
Не знаю, что мне хочется больше, расколотить в осколки ей чип или таки отнести в сервис.

На этом эксперименты с пайкой окончены.
- одна карта короче.
Не так жалко 65 тящ, которые я отдал за эту потаскуху майнерскую, сколько жалко времени. Все праздники нихуя не получится эксперимантировать и хуй знает сколько ещё.
Дерьмо блядь.
Аноним 09/05/25 Птн 03:02:29 #44 №1195231 
image.png
Аноним 09/05/25 Птн 03:05:16 #45 №1195232 
>>1195229
Ожидаемый результат.
Ну хоть в в радиолюбителя поиграл
Аноним 09/05/25 Птн 03:10:41 #46 №1195235 
The Great Quant Wars of 2025
https://www.reddit.com/r/LocalLLaMA/comments/1khwxal/the_great_quant_wars_of_2025/
кек
Аноним 09/05/25 Птн 03:14:41 #47 №1195236 
image.png
image.png
На 12б такое может?
Аноним 09/05/25 Птн 03:57:17 #48 №1195247 
Обнаружил что гемма лучше всего рпшит вообще... без промпта, охуеть да?
Вот вообще нахуй ни слова в промпте и сразу многовековые описания верхней полки перестало высирать, вздохи ахи пуки, больше диалогов ради чего я в общем и рпшу
Аноним 09/05/25 Птн 04:04:29 #49 №1195248 
>>1194231 →
Спасибо за подгон.
Вот только…. Эммм…
Это новый уровень рп с пустым системным промтом ?

>>1195247
Обнаружил что гемма относительно быстрая, умная, но все это разбивается о её солнечный аутизм. Она неожиданно подходит для агентов, но как РП нейрона лоу сегмента - остоебенила кратно быстрее чем мистраль.

Вот все больше убеждаюсь, что мистраль рабочая лошадка и наше всё.
Аноним 09/05/25 Птн 04:36:48 #50 №1195252 
>>1195236
12б сомнительно, квк - может
Аноним 09/05/25 Птн 04:51:52 #51 №1195254 
image.png
image.png
Сегодня я открыл что если вменяемо назвать файлы бэкграундов в таверне(например Совенок-Площадь-День), а потом создать пикрел1 скрипт для Quick Reply - то после каждого сообщения ИИ таверна будет автоматически подбирать задник под происходящее в тексте с довольно высокой точностью. В комбинации с паком спрайтов для character expressions, подобранной музыкой для dynamic music и подробным лорбуком - получается полноценная работающая визуальная новелла.
Аноним 09/05/25 Птн 06:22:38 #52 №1195265 
Основная проблема в изучении английского это тебе не матан или айти где идёшь по нарастающей от легкого к сложному - читать ты начинаешь сразу и то что тебе нравится, а там сразу сложный язык идёт
Аноним 09/05/25 Птн 07:25:09 #53 №1195271 
image
Опять языкосрач... не надоело? Свободно читаю на английском, прочитал кучи книг, фанфиков, и вн-ок, а также манов и гайдов (программист это диагноз).

Но когда есть возможность читать на родном языке, оно всё же приятнее.
Аноним 09/05/25 Птн 07:45:12 #54 №1195276 
https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7/dont_offload_gguf_layers_offload_tensors_200_gen/
Аноним 09/05/25 Птн 08:26:01 #55 №1195283 
>>1195254
>после каждого сообщения ИИ таверна будет автоматически подбирать задник под происходящее в тексте с довольно высокой точностью
Спасибо, это ценно.
Аноним 09/05/25 Птн 08:40:12 #56 №1195285 
>>1195276
>https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7/dont_offload_gguf_layers_offload_tensors_200_gen/
Теперь более-менее понятно, что крутить.
Аноним 09/05/25 Птн 08:58:26 #57 №1195288 
>>1195285
У всех по разному работать будет, но вот у меня выгрузка части ffn_gate и ffn_up при --n-gpu-layers 99 дало буст с 1.5-2.2 т/с до 3.0 т/c надо ещё другие покрутить, вроде с квеном может бы выгоднее выгрузить ffn_down

Или забить на скорость, но тогда смогу запустить 4 квант.
МОЗГИИИИИ.
Аноним 09/05/25 Птн 09:15:07 #58 №1195294 
Чому ещё не подвезли спец ускорители с большим объёмом памяти на одной плате для обычных смертных? Это же золотая жила для всяких стартапов. Я знаю, есть есть оборудование от нвидия, но оно стоит как квартира, а то и две. Какие есть бюджетные варианты для вкатата в большие модели 120б++?
Аноним 09/05/25 Птн 09:15:36 #59 №1195296 
image
только почему оно лезет в общую память если выделенная не заполнена ещё?
Аноним 09/05/25 Птн 09:18:15 #60 №1195297 
>>1195294
>Это же золотая жила для всяких стартапов.
Казалось бы, да? А в реальности уже полуподвальные китайцы клепают всяких франкенштейнов и продают их отнюдь не по демократическим ценам - и у них хорошо покупают. А "стартапы" как два года назад сосали, так и сейчас сосут.
Аноним 09/05/25 Птн 09:56:31 #61 №1195317 
>>1195248
> Это новый уровень рп с пустым системным промтом ?
Вставь туда любой предпочтительный системный промпт. Для этого он пустой.

>>1195254
Это все еще ванильный qwq? Ты так и не ответил, какой квант, какой пресет.

>>1195294
Через 1-2 поколения, вероятно. Тогда же и модели станут еще круче. Куда торопиться?
Аноним 09/05/25 Птн 10:10:56 #62 №1195321 
>>1195317
>Через 1-2 поколения, вероятно. Тогда же и модели станут еще круче. Куда торопиться?
К 80-му году мы будем жить при нейрокоммунизме?
Аноним 09/05/25 Птн 10:15:27 #63 №1195323 
>>1195321
1-2 поколения видеокарт, анон...
Аноним 09/05/25 Птн 10:16:49 #64 №1195324 
>>1195323
>1-2 поколения видеокарт, анон...
Ну это ещё и не коммунизм. И за деньги (немалые), и AGI тогда ещё не будет.
Аноним 09/05/25 Птн 10:21:05 #65 №1195325 
>>1195324
> коммунизм
Коммунизма не было и не будет. Никто не будет в обществе горбатиться за то, чтобы ты мог нихуя не делать и кумить на 120б+ моделях.
Бюджетный вкат - это риг на теслах, вполне подъемные деньги для среднестатистического работяги.
Аноним 09/05/25 Птн 10:25:02 #66 №1195327 
>>1195325
Был, сейчас дешевле взять одну 3090
Аноним 09/05/25 Птн 10:28:02 #67 №1195328 
desire.png
Господа, а как вы генерите картинки для кума в процессе диалога? Pony классная модель, сразу и без ебли генерит классные изображения, но проблема в том, что в мою 8Гб 3070Ti не влезает одновременно LLM и генерация изображений. LLM же, падла, не вылезает из VRAM, и когда она запущена, и на генерацию изображений тупо не хватает ресурсов. Я бы за какую-нибудь копеечку арендовал что-нибудь в облаке, вроде у CivitAI есть возможность крутить чекпойнты, но хз, можно ли их подружить с Таверной и сколько это вообще стоит.

Другая проблема - РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений. Ей бы для этих целей другую температуру и другой шаблон промпта сделать, но в Таверне вроде не настраивается это.
Аноним 09/05/25 Птн 10:28:57 #68 №1195329 
>>1195327
Ага. Сколько врама в риге на теслах? Сколько врама у одной 3090?
Вопрос в 120б+ моделях, нет?
Аноним 09/05/25 Птн 10:32:16 #69 №1195331 
>>1195327
>Был, сейчас дешевле взять одну 3090
Только толку-то с неё одной. Если брать одну карту, то уже 5090 и к ней (в будущем) собрать серверок с 256гб восьмиканальной DDR5. Или побольше. Тогда и крупные MoE-шки катать можно будет. А 3090 нужно минимум 3.
Аноним 09/05/25 Птн 10:36:00 #70 №1195333 
>>1195328
>Господа, а как вы генерите картинки для кума в процессе диалога?
Ну как, как. 3x3090 на сервере, одна в основном компе. Только это всё на будущее - там и динамические картинки, и озвучка, и даже видео (как раз вчера real-time модель выкатили). А пока что ни качественного промпта, ни хорошей реализации всего этого.
Аноним 09/05/25 Птн 10:36:33 #71 №1195334 
>>1195331
> 5090
До сих пор для ллмок по цене/качеству нет ничего лучше 3090 с Авито. Разумеется, у нормального продавца с тестами, которые ты проведешь сам.
Ждать нужно, через 1-2 поколения видюх врама будет больше. В 5060 8гигов видеопамяти, что катастрофически мало в 2025 году. Будут поднимать у всей линейки, плюс мб выйдут гпу для нашей ниши - полуигорные, полуиишные.
Аноним 09/05/25 Птн 10:39:11 #72 №1195336 
>>1195328
>РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений.
Небольшая thinking-модель на отдельной карте могла бы зарешать этот вопрос. Посоветуйте такую, чтобы ещё и генерация картинок влезала (24гб).
Аноним 09/05/25 Птн 10:42:56 #73 №1195339 
>>1195336
Покупать вторую карточку для кума, ну ебать спасибо нахуй.
Аноним 09/05/25 Птн 10:45:34 #74 №1195342 
>>1195334
>До сих пор для ллмок по цене/качеству нет ничего лучше 3090 с Авито. Разумеется, у нормального продавца с тестами, которые ты проведешь сам.
Это так, но есть проблемка производительности с новыми квантами. 4090 стоит больше чем втрое, но и производительнее с ними втрое, 5090 - пропорционально (так что смысла брать 4090 нет совсем). Другое дело, что всё это очень небюджетно.
Аноним 09/05/25 Птн 11:00:58 #75 №1195349 
>>1195342
> есть проблемка производительности с новыми квантами
Да ладно уж, в деле ллмок врам первостепенен. Достаточно у 3090 железа, чтобы выдавать необходимые для комфортного чтения 8-12 токенов.
Аноним 09/05/25 Птн 11:15:23 #76 №1195355 
>>1195329
m40,k80 - 24гига за 12к
m10 - 32 гига за 16к (но у неё архитектура говно)
Аноним 09/05/25 Птн 11:17:30 #77 №1195357 
>>1195355
Риторический вопрос был, да. Анон спрашивает, как дешевле гонять 120б модели, а потом говорит, что дешевле взять 3090.
Самый бюджетный вкат - очевидно, теслы.
Аноним 09/05/25 Птн 11:18:41 #78 №1195360 
>>1195336
А какие есть thinking aliberated модели?
Аноним 09/05/25 Птн 11:20:10 #79 №1195361 
>>1195360
https://huggingface.co/mradermacher/QwQ-32B-abliterated-GGUF
Аноним 09/05/25 Птн 11:38:50 #80 №1195369 
>>1195328
> Господа, а как вы генерите картинки для кума в процессе диалога?
Никак. ImageGen модель кушает врам, а значит нужно либо жертвовать контекстом, либо квантом модели. Неприемлемо.
К тому же воображение лучше справляется.
Аноним 09/05/25 Птн 11:41:41 #81 №1195370 
Спросил тут Дипсик ,
сколько миллиардов параметров было бы у человеческого мозга, если бы он был моделью нейросети:



Большинство источников указывает 100–500 триллионов синапсов, но чаще всего используется оценка ~100 триллионов.

Итоговая оценка
Если считать каждый синапс аналогом одного параметра (веса связи в нейросети), мозг как модель нейросети имел бы:
~100 триллионов параметров (100000000000000 и

Сравнение с современными ИИ
GPT-4: ~1.7 триллиона параметров.

Человеческий мозг: ~100 триллионов параметров (в 60 раз больше, чем GPT-4).

Важные уточнения
Синапсы ≠ параметры. В реальности мозг работает не как искусственная нейросеть: синапсы динамически меняются (пластичность), а нейроны имеют сложные биохимические механизмы, которые не сводятся к простым "весам".

Энергоэффективность. Мозг потребляет ~20 Вт энергии, тогда как обучение нейросетей с триллионами параметров требует мегаватт.

Плотность информации. Один кубический миллиметр коры мозга содержит ~50000 нейронов и ~130 млн синапсов — это на порядки плотнее, чем микросхемы.




Короче не скоро получим рп уровня живой тян, анчоусы
Аноним 09/05/25 Птн 11:52:05 #82 №1195375 
>>1195317
>Это все еще ванильный qwq?

Это я тестил сноудроп с настройками треда которые с пустым инструкт промптом. Они реабилитировали сноудроп в моих глазах.

>Ты так и не ответил, какой квант, какой пресет.

Если ты про ванильный qwq, то я его на ванильных настройках использовал с парой изменений.
Аноним 09/05/25 Птн 11:53:40 #83 №1195377 
>>1195375
> Они реабилитировали сноудроп в моих глазах.
Рад, что тот пресет тебе помог. Не понимаю, как авторы Сноудропа проглядели, что их сэмплер настолько плох и поместили его в ридми модели.
Может кто-нибудь из тредовичков тоже даст второй шанс Сноудропу, с правильным сэмплером.
Аноним 09/05/25 Птн 11:57:28 #84 №1195379 
Если кто проглядел, вот ссылка - https://huggingface.co/ArliAI/QwQ-32B-ArliAI-RpR-v3/blob/main/RpR-v3-master-export.json
Аноним 09/05/25 Птн 11:57:41 #85 №1195380 
>>1195361
Ебать, минимум 16Гб, ну спасибо. Речь же шла про "небольшую" модель.
Аноним 09/05/25 Птн 12:02:33 #86 №1195385 
>>1195370
Ты не забывай, что у человека дохуя ненужных синапсов в мозгу. Чтобы дышать, ходить, переваривать пищу, регулировать температуру тела - нужно дохуя вычислительной мощности. Без тела можешь спокойно делить эту цифру на 10.
Плюс, сколько мощности жрет стресс, самокопание, мечты, фантазии? Все это рудименты и артефакты хуевой архитектуры человека и дырявой системы вознаграждения. У нейросетей сразу нормальный эвристический алгоритм, который куда эффективнее гормональной дрочки.
Вот и получится, что нейросеть с параметрами на порядки ниже, но с нормальной архитектурой и без лишнего багажа вскоре окажется "умнее" человека.
Аноним 09/05/25 Птн 12:04:45 #87 №1195390 
>>1195369
Так мой вопрос как раз был о том, как вынести генерацию картинок в облако, чтобы не жрать локальный ресурс.
Аноним 09/05/25 Птн 12:06:46 #88 №1195392 
>>1195385
А, еще не забывай, что человек все крутит на локалке, которую годами обучает с нуля. У нейромозгов возможен хайвмайнд в дата-центре, который куда эффективнее и выгоднее.
Аноним 09/05/25 Птн 12:07:18 #89 №1195393 
>>1195357
>Самый бюджетный вкат - очевидно, теслы.
прав.
4 теслы у меня уже ебашат больше года, а 3090 сгорела не проработав и месяца.
Я брал две 3090, каждая за 65.
В итоге спустя месяц получилось, что я купил одну 3090 за 130к.
Думайте, карлики.
Аноним 09/05/25 Птн 12:10:53 #90 №1195396 
>>1195393
А чем, прости, ты занимаешься на четырех теслах?
Аноним 09/05/25 Птн 12:18:01 #91 №1195399 
>>1195396
Запускаю свой неповторимый Магнум 123б и дрочу на единственный сценарий в его датасете... почти~.
Аноним 09/05/25 Птн 12:23:03 #92 №1195401 
>>1195399
блять, как же я засидую тем, кто может позволить себе запускать нормальные модели...
мне мать дает слишком мало денег, я смог позволить себе только одну 3090 убитую. Вот, сижу дрочу на гемме3, всё уже понял....
Она конечно туповата.... но выбора у меня нет. Я ведь нищий(
Господи как же хочется запустить магнум 123б....
Аноним 09/05/25 Птн 12:25:09 #93 №1195402 
>>1195392
Согласен. Кстати, тот же Дипсик просветил, что идут исследования и пилятся нейроморфные чипы, которые должны быть энергоэффективнее чем лласнве процессоры, которые для серьёзного развития нейронок в будущем уже не подойдут.

Погуглил, а то вдруг он придумал, но действительно:

>>Исследователи Центра прикладной нелинейной динамики БФУ им. И. Канта разработали химический чип, запоминающий и распознающий ритмические сигналы. Чип представляет собой возбудимую реакционно-диффузионную среду реакции Белоусова-Жаботинского (БЖ) на основе специального полимера с вшитым катализатором. Схема чипа в чем-то схожа с электронной микросхемой на полупроводниках, но вместо электрического тока по его дорожкам бегут химические волны. Такая передача сигналов по химическим волноводам напоминает распространение потенциала действия в аксонах живых нейронов.

>>В разработке исследователи используют технологию фотопечати (патент №2790172). На предметное стекло наносится тонкий слой прегеля, который затем в течение нескольких минут экспонируется через специальную маску. После, незаполимеризованные остатки прегеля удаляются, и на поверхности стекла остается полимерная «интегральная схема». Этот процесс похож на фотолитографию, используемую в производстве кремниевых микросхем


Еще Дипсик заявил, что есть экспериментальные модели на принципах импульсной (спайковой) нейросети, которая

>>Является самой реалистичной, с точки зрения физиологии, моделью


Но где бы такие модели пощупать...
Аноним 09/05/25 Птн 12:27:05 #94 №1195405 
>>1195402
>обычные процессоры

Поправил
Аноним 09/05/25 Птн 12:28:03 #95 №1195407 
>>1195401
Ой, шутник~. Тебе же ничего не мешает прямо сейчас его запустить! Думаешь, смог обмануть нас? Smirk wink smirk.
Аноним 09/05/25 Птн 12:32:35 #96 №1195409 
>>1195407
гемма3-бой, зачем ты кривляешься?
Аноним 09/05/25 Птн 12:33:22 #97 №1195411 
>>1195409
Зачем ты так, ножом по сердцу? Я Мистралешиз.
Аноним 09/05/25 Птн 13:23:24 #98 №1195493 
>>1195409
>>1195411
Вы оба никчемны.

Истинный лама энджоер.
Аноним 09/05/25 Птн 13:25:46 #99 №1195497 
Кто-то юзал SpikeGPT? Это реально запустить простому селянину?
Аноним 09/05/25 Птн 13:26:59 #100 №1195499 
>>1195209
> Пайка получилась грязная потому что безсвинцовый припой не хотел липнуть к моему оловянно-свинцовому.
В целом задача была крайне простая, залудить верхнюю часть преда и напаять прямо поверх него, там и контакта припоев не должно быть. Раз такое дело - лучше больше никуда не лезь. 0.2 это многовато на такую длину, достаточно просто от тонкого многожильного одну, но в целом пофиг.
>>1195229
Оварида, у вас прогар врм. Наколхозят ампутировав фазу или пересадят чип-память на плату донора или разведут тебя что они - хлам чтобы получить живые чипы.
>>1195235
То что фикседкванты по известному алгоритму могут сделать почти все (нет) - и так было понятно. А вот как там накрутили тесты, что у них q2kl является однозначным лидером в одном из тестов - уже интересно.
Аноним 09/05/25 Птн 13:39:08 #101 №1195524 
>>1195247
> многовековые описания верхней полки перестало высирать, вздохи ахи пуки
Так ты посмотри что пишут в типичных "йоба текен ультра мега рп пресет". Так же буквально запрос всей этой херни, которому модель просто следует, лучше уже ничего чем такое. Но это совсем крайность, нормальный системный промт без этого наиболее оптимален.
>>1195248
> Она неожиданно подходит для агентов
Не неожиданно а закономерно, еще вторая в этом ебала. И главное, она может как в ризонинг, причем не строго прибитый - задроченный а именно по инструкции, так и в зирошоты с учетом инструкций.
>>1195294
Нормисы не окупят. Корпы потребуют достойного уровня сервиса, гарантий и поддержки, Цикл разработки долгий и дорогой, пузырь может лопнуть раньше.
В итоге имеем только небольшой абуз лазеек в готовых девайсах.
> Какие есть бюджетные варианты для вкатата в большие модели 120б++?
Риг из 3090, дешевле нет.
Аноним 09/05/25 Птн 13:44:06 #102 №1195529 
>>1195524
> Риг из 3090, дешевле нет.
> несколькими сообщениями выше обсуждают риг из тесл, что в 2 раза дешевле.
> еблан?
Аноним 09/05/25 Птн 13:45:06 #103 №1195533 
>>1195254

Последнее что остается - понять механизм групп и автоматизировать его. В моем идеальном мире все персонажи новеллы сразу находятся в группе, но отключены. Включена только карточка гейммастера новеллы, которая двигает сюжет, вводит персонажей и самое главное - включает или отключает карточки по необходимости. Сейчас карточки надо включать и выключать вручную, что ломает весь опыт. Пока что мне удалось только заставить гейммастера самого отыгрывать всех персонажей, основываясь на лорбуке и собственном знании новеллы оказалось что квены знают бл в подробностях, например что Лена живет в 13 домике, что я не прописывал ни в её карточке, ни в лорбуке), но это не позволяет использовать спрайты, поскольку спрайты подключены к конкретным карточкам-персонажам. Но я думаю что через скрипты можно попробовать что-то достичь. И еще бы автоматическое распознание костюмов у спрайтов например включать голые спрайты во время секса, но это уже бонус, новелла может работать и без этого на ручном переключении костюмов.
Аноним 09/05/25 Птн 13:49:26 #104 №1195540 
>>1195529
>риг из тесл
деньги на ветер
Аноним 09/05/25 Птн 13:58:57 #105 №1195552 
>>1195529
Риг из тесел по скорости работы примерно как 14700kf+z790+248гб ддр5
думой*
Аноним 09/05/25 Птн 14:07:17 #106 №1195560 
>>1195533
> В моем идеальном мире
...Дипсик на 10% быстрее Квена 3 32б.
Аноним 09/05/25 Птн 14:07:28 #107 №1195561 
>>1195552
>Риг из тесел по скорости работы примерно как 14700kf+z790+248гб ддр5
Первые 5к контекста может быть. А дальше жопа будет.
Аноним 09/05/25 Птн 14:15:37 #108 №1195567 
>>1195369
>Никак. ImageGen модель кушает врам, а значит нужно либо жертвовать контекстом, либо квантом модели. Неприемлемо.
Тут анон выше кинул идею с autobg для таверны. Короче берёшь большой пак порнухи, растягиваешь (ну или обрезаешь) картинки под background-разрешение, обзываешь их согласно содержимому (на русском и английском, ну или две копии делаешь) и запускаешь скрипт. Можно не на постоянку, а по кнопке. Он подберёт что-нибудь подходящее к случаю.

Аноны, реквестирую такой пак.
Аноним 09/05/25 Птн 14:17:31 #109 №1195569 
>>1195567
Тебе надо - ты и делай. Поделишься потом с тредом, правда ведь?
Аноним 09/05/25 Птн 14:21:04 #110 №1195571 
>>1195569
>Тебе надо - ты и делай. Поделишься потом с тредом, правда ведь?
"Я стратег, я двигаю идеи"(с)
Аноним 09/05/25 Птн 14:21:10 #111 №1195572 
>>1195399
Т.е. ты потратил многие тыщи баксов ради текстового кума?
Аноним 09/05/25 Птн 14:29:43 #112 №1195577 
>>1195572
>Т.е. ты потратил многие тыщи баксов ради текстового кума?
Смешно, правда? другой анон, который тоже потратил
Кум кумом, а ведь революция произошла. Хз даже с чем сравнить-то, с интернетом разве. Я может всю жизнь мечтал, а вот оно.
Аноним 09/05/25 Птн 14:33:19 #113 №1195581 
>>1195577
Не, кум - дело благородное, но разве меньшие модели не вытягивают для этих целей?
Аноним 09/05/25 Птн 14:45:14 #114 №1195602 
>>1195560

Что ты несешь блядь.
Аноним 09/05/25 Птн 14:45:31 #115 №1195603 
>>1195581
>Не, кум - дело благородное, но разве меньшие модели не вытягивают для этих целей?
В простых случаях, или если повезёт, то вытягивают. А так скачешь, как горный козёл, с Магнума на Люминум, а с него на Комманд-А, иногда и 70В-тюном не погнушаешься - для остроты. Они все разные, как кошки. Сэмплеры крутишь, как заправский гонщик руль.
Аноним 09/05/25 Птн 14:47:31 #116 №1195607 
>>1195401

Выгружай слои на оперативку, в чем проблема?
Аноним 09/05/25 Птн 14:48:10 #117 №1195608 
>>1195328
>РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений.
Юзай flux хрому а не пони, та умеет из обычного описания генерировать хорошо. Всего-то нужна будет ещё одна 5090 чисто под неё (потому что в 24гига не влезает)
Аноним 09/05/25 Птн 14:51:35 #118 №1195614 
>>1195529
> риг из тесл
Это совсем гнилая тема, ужасно медленные и для 120+ неюзабельны, дорогие для своих статов, бесполезны везде кроме инфиренса ллм на жоре. Советовать их может только тот, кто хочет свое говно распродать, или желает затащить в свое болото очередную жертву.
>>1195552
> 248гб ддр5
Там же 2 х 48 и проеб разметки макабы?
>>1195561
На теслах генерация превращается в тыкву с контекстом точно также если не больше.
>>1195393
Это карма, лол.
Аноним 09/05/25 Птн 14:51:58 #119 №1195616 
>>1195393

Лол блядь, так это у тебя 3090 сгорела, теслашизик. Так тебе и надо, довыебывался. Нехуй срать было какой ты охуенный что додумался по дешевке доесть говно из под майнера, а остальные нищуки и долбоебы, раз не хотят такой же финт жопой провернуть.
Аноним 09/05/25 Птн 15:01:35 #120 №1195623 
>>1195614
> проеб разметки макабы?
Да, она сожрала * с начала второй строчки.
Но можно вставить и 4 плашки по 64 гига теперь. Но они будут плохо работать на высоких частотах потому что 64 гига только недавно до десктопов дошли и потому что 4 плашки.
Аноним 09/05/25 Птн 15:03:46 #121 №1195629 
>>1195407
Я сейчас тебя укушу не спросив!
>>1195567
Кмк, здесь сильно теряется вариативность и отзывчивость, оно будет делать просто что-то по мотивам, а не то что хочешь. Няшишь ты канничку в доггистайл, а там выезжает милфа на спине, или наоборот.
Для некоторых чаров заготовлены спрайты (есть на чубе), вплоть до подробной ебли, если уж делать то именно так. Как раз будет экспириенс внки.
>>1195603
> на Комманд-А
Оригинальный или тюн? Какие сценарии на нем играешь?
>>1195616
Не стоит забывать что тред уже насчитывает две мертвые теслы, в одной было похоже на траблы с драйвером и потом совсем отрыгнула, по второй анончик жаловался на отвал из nvidia-smi но потом пропал.
Аноним 09/05/25 Птн 15:15:46 #122 №1195643 
>>1195629
>Оригинальный или тюн? Какие сценарии на нем играешь?
Fallen, от TheDrummer'а который. Пробую на всём, даже на русском - оригинальный датасет дорогого стоит.
Аноним 09/05/25 Птн 15:41:46 #123 №1195684 
изображение.png
>>1195296
Оно просто так туда лезет, даже на чистой системе. Забей, это не кобольд на пару мегабайт вылез, а другие процессы.
>>1195325
>Никто не будет в обществе горбатиться за то, чтобы ты мог нихуя не делать и кумить на 120б+ моделях.
ИИ будет. Собственно кроме куммунизма я никакой общественной формации в эпоху развитого ИИ не вижу.
>>1195333
>как раз вчера real-time модель выкатили
Подскажи название.
>>1195342
>Это так, но есть проблемка производительности с новыми квантами.
А они нужны? 4км хватит каждому.
>>1195357
>Самый бюджетный вкат - очевидно, теслы.
Был, когда они стоили по 16к. За 30-40 они нахуй уже не нужны, перфоманс от цены не вырос.
>>1195393
>В итоге спустя месяц получилось, что я купил одну 3090 за 130к.
Хуйня. Вот 3080ti за 155к...
>>1195581
Человек животное жадное, всегда хочет лучшего. Ну ещё и ни одна модель не смогла удовлетворить меня, включая корпов с 2трлн параметров.
>>1195623
>Но они будут плохо работать на высоких частотах
Не то чтобы плохо... Просто никак. Хорошо если 5200 возьмёт, а то и придётся на джедекоских 4800 сидеть.
Аноним 09/05/25 Птн 15:57:47 #124 №1195718 
>>1195603
Это понятно, что четыре теслы дадут больше простора для творчества, но типа это реально того стоит? Вот прям подрочить на текст? Не на какой-нибудь йоба-фильм, который рисуется в реальном времени и ты даешь указания героям, а они это делают, а простой текстовый РП, доступный всем нищукам, просто более быстрый и чуть более качественный?
Я не пытаюсь тебя доебать, просто мне кажется, что если тратить СТОЛЬКО денег, должна быть цель более высокая. Например, крутить сервер для коммерческих целей, или тренировать какие-то специфические нейронки за деньги или ради искусства, и так далее.
Аноним 09/05/25 Птн 16:07:18 #125 №1195734 
>>1195684
> Забей, это не кобольд на пару мегабайт вылез, а другие процессы.
Это именно кобольд, он еще до того как веса загрузит там что-то резервирует.
> Хорошо если 5200 возьмёт
Как раз хватит, лол. И это будет 256 гигов же. А 2х48 есть быстрые.
>>1195718
> но типа это реально того стоит?
Не стоит. Как-то можно было бы притянуть для крутой мое, что туда бы помещалась. Но, во-первых, обработка контекста будет страшной и ужасной, замедление с ростом контексте огромным, таких моделей нет (хотя вообще ллама4-скаут в теории), мое само по себе неоче.
> какой-нибудь йоба-фильм, который рисуется в реальном времени и ты даешь указания героям
За такую технологию отвалят много миллиардов (уже), как минимум для того чтобы ее монетизировать и продавать, и не выпускать просто так наружу. Слишком жадные у тебя запросы, скажи еще что 100к, за которые в хорошие времена легко собирался риг из 4х тесел, ты бы отдал только за полную симуляцию с погружением.
> что если тратить СТОЛЬКО денег, должна быть цель более высокая
Сколько? Отдают миллионы за гниющую кредитопомойку, сотни тысяч за какие-нибудь лыжи, костюм и т.д.
Аноним 09/05/25 Птн 16:13:52 #126 №1195740 
>>1195718
>Я не пытаюсь тебя доебать, просто мне кажется, что если тратить СТОЛЬКО денег, должна быть цель более высокая. Например, крутить сервер для коммерческих целей, или тренировать какие-то специфические нейронки за деньги или ради искусства, и так далее.
Риг на 3090-х стоит столько же, сколько одна 5090. Покупка одной топовой видеокарты не требует высоких целей. И покупка рига не требует, просто цели другие. Берут просто для удовольствия - это кстати и лучше, чем если "карта нужна для работы".
Аноним 09/05/25 Птн 16:18:34 #127 №1195745 
>>1195684
>Подскажи название.
LTX-Video
https://www.reddit.com/r/LocalLLaMA/comments/1kgrjor/new_opensource_video_generation_model/
Аноним 09/05/25 Птн 16:32:12 #128 №1195753 
>>1195608
>Юзай flux хрому а не пони, та умеет из обычного описания генерировать хорошо. Всего-то нужна будет ещё одна 5090 чисто под неё (потому что в 24гига не влезает)
А вот это видел?
https://www.reddit.com/r/LocalLLaMA/comments/1kgzey8/run_flux1_losslessly_on_a_gpu_with_20gb_vram/

Теперь влезет, дев обещал адаптировать для Комфи.
Аноним 09/05/25 Птн 16:32:46 #129 №1195754 
Кто-то что-то пробовал в плане импульсных нейронных сетей?
Аноним 09/05/25 Птн 16:43:09 #130 №1195762 
>>1195276
Вот это интересно, еще бы хорошо научить автоматически это делать. Какой нибудь отдельный бенч в llama.cpp который перебирает варианты слоев и выгрузку на гпу автоматически и тестит скорости был бы просто охуенным. Ну или накорябать скрипт отдельный, но это сложнее.
Аноним 09/05/25 Птн 16:46:49 #131 №1195767 
>>1195754
Исследований по жидким нейронным сетям не так много, а весов вобще нет на сколько знаю.
Основная проблема жидких нейронок на сколько я помню - невозможность использования обычного для ии обучения с помощью градиентного спуска.
А это считай святой грааль нейронок, без него никто ничего не может.
У них короче много проблем с обучением поэтому пока что выглядят круто только в теории.
Аноним 09/05/25 Птн 16:48:05 #132 №1195768 
>>1195734
>Как раз хватит, лол.
Кому как. Деградировать с 6400 как-то обидно.
>>1195745
Спс.
>>1195754
Никто.
Аноним 09/05/25 Птн 18:27:57 #133 №1195890 
Ох, как же QwQ следует за промтом карточки. Как же он…. Заебал.
Я неиронично ссался кипятком от такого уровня работы с контекстом, с ризонингом он и соврет, и выкрутится - но буквально как Хью Лори сидишь и такой : эврибади лай.
Но это абсолютно непробиваемо без прямых указаний. Даже подумать не мог, что это может так раздражать. Персонажи как бетоном залиты.
Аноним 09/05/25 Птн 18:34:27 #134 №1195898 
f.png
какие подводные?
Аноним 09/05/25 Птн 18:37:56 #135 №1195906 
>>1195898
>какие подводные?
Могут наебать
Если сдохнет - тоже попал на бабки
Шумная

В остальном народ вроде доволен.
Аноним 09/05/25 Птн 18:38:09 #136 №1195907 
владимир путин молодец.mp4
каким софтом делать такое? и хватит ли предыдущего пикрила или нужен десяток A100?
Аноним 09/05/25 Птн 18:39:46 #137 №1195911 
А можно ли замутить такую штуку, чтобы Таверна выгружала LLM из памяти перед генерацией изображения, затем генерила его и загружала LLM обратно?
Аноним 09/05/25 Птн 18:42:50 #138 №1195919 
Интересно, есть ли варик автоматом дописывать лорбук? Типа чтобы модель сама решала, какие события важные, определяла ключевые слова и делала запись?
Аноним 09/05/25 Птн 18:43:43 #139 №1195920 
>>1195911
>А можно ли замутить такую штуку, чтобы Таверна выгружала LLM из памяти перед генерацией изображения, затем генерила его и загружала LLM обратно?
Если уж это тебе настолько надо, то купи уже вторую видяху для картинок.
Аноним 09/05/25 Птн 18:44:38 #140 №1195922 
>>1195920
Дай деняк.
Аноним 09/05/25 Птн 18:45:20 #141 №1195924 
А представьте 4 гемму с 123б параметров
Аноним 09/05/25 Птн 18:51:20 #142 №1195933 
>>1195911
Можно, пишешь прозрачный прокси, к которому и будут подключатся с одной стороны таверна а с другой бекенды к текст и картинко генераторам
Делаешь условие что если получен запрос на генерацию картинки текстовый бек вырубается и загружается картиночный, потом при текстовом запросе меняются местами.
Это будет долго и тормазнуто, но будет работать. В основном изза того что на загрузку модели в память уходят секунд 10 минимум как и на загрузку бекенда с нуля, потом чтение промпта предыдущих сообщений если речь про текстовую сетку, и только потом она даст ответ
Аноним 09/05/25 Птн 19:20:59 #143 №1195981 
Обниморду заблокировали? Без впн не заходит.
Аноним 09/05/25 Птн 19:22:12 #144 №1195984 
>>1195981
У меня работает. Ростелеком провинциальный.
Аноним 09/05/25 Птн 19:24:19 #145 №1195990 
>>1195924

Ты только что гемини
Аноним 09/05/25 Птн 19:39:03 #146 №1196009 
>>1195990
гемини на 2к биллиона
Аноним 09/05/25 Птн 20:02:10 #147 №1196040 
>>1195768
> Деградировать с 6400 как-то обидно.
Хера ты амдшников всех приложил.
>>1196009
По заявлениям, и один хуй мое а не плотная.
Аноним 09/05/25 Птн 20:45:08 #148 №1196118 
изображение.png
>>1196040
>Хера ты амдшников всех приложил.
? Я сам амудешник.
Аноним 09/05/25 Птн 20:54:09 #149 №1196128 
>>1195614 >>1195616
>карма
хуярма блядь.
Заебали вы, клоуны.
"поделом тебе" , "карма".
Я вообще нахуй святой по сравнению с вами. Шакалы блять, смеются над успешным человеком.
Особенно мой фанат, говно какое-то которое носится за мной по треду и орет "токсичный" как только меня видит. Хуй знает, чем я дупу ему разворотил. Вероятно тем, что он нищук ёбаный, а я - нет.
sage[mailto:sage] Аноним 09/05/25 Птн 21:07:34 #150 №1196149 
> успешный
> не нищук
> P40 с помойки
как называется эта болезнь?
Аноним 09/05/25 Птн 21:23:36 #151 №1196186 
image.png
image.png
image.png
Купил наконец свою первую 3090, до этого видюхами не интересовался вообще, и нихуя о них не знаю.
Потыкал - в мой обычный корпус и мать 2 шт теоретически влезает, но если это 2.7 - то прям впритык.
Так и надо, или поискать потоньше, или менять все к хуям?
Из чисто двухслотовых на лохито есть турбы, которые пишут сама нвидия забанила за то що их брали вместо серверных, но я так и не нашел отзывов как они для набива в домашнюю пеку.
Теоретически есть на 2 с небольшим xc3, но на лохито их сейчас нет.
И есть туфы, которые по размерам вроде на полсантиметра короче всех остальных 2.7.
Шо посоветуете?
Аноним 09/05/25 Птн 21:37:02 #152 №1196219 
>>1196186
> Шо посоветуете?
Квен 3 32б запусти, 3090 хватит. Он в лучшем случае на 10% хуже Дипсика. Не нужно докупать железо.
Аноним 09/05/25 Птн 21:40:21 #153 №1196229 
>>1196186
>до этого видюхами не интересовался вообще, и нихуя о них не знаю.
Огнетушитель купи.
Аноним 09/05/25 Птн 21:41:10 #154 №1196231 
>>1196128
Агришься, выпендриваешься, делаешь ахуительные заявления и много выебываешься. Нет тут святости, ты рили васян-токсик по общению, был бы сдержаннее, уважительнее к другим и менее максималистичным - все бы тебя утешали и сочувствовали.
Еще не забыто как ты накрутил шизосемплинг и всякого, что модели не могли на элементарные вопросы ответить, а крыл хуями и обвинял всех кроме себя.
> над успешным человеком
Успешный человек не только в 25 году не будет использовать теслы, но и будет обладать всеми теми описанными качествами.
>>1196186
Обычно карты выносят на райзерах (х16) туда, где есть место.
Аноним 09/05/25 Птн 21:42:08 #155 №1196232 
>>1195919
Технически возможно, то есть можно просить модель дополнительно выписывать словечки и пояснения, чтобы это астоматически добалялось в лорук и стиралось из вывода. Попросите на вашего программиста, написать такой плагин.

Но модель может криво выписывать словечки и может всякую хуйню считать важной. Это уже зависит от модели.
Аноним 09/05/25 Птн 21:42:54 #156 №1196234 
>>1196219
>Он в лучшем случае на 10% хуже Дипсика
Че ты несешь болезный? Квен хорош, но он хуже не на 10 процентов. По знаниям и мозгам он проигрывает значительно.
Это только в каких то тестах от это отставание в тестах на 10 процентов показывает.
Правда ты забыл уточнить что там каждый процент отставания сам по себе процентов на 10 разницу показывает, и чем выше тем труднее его набрать и тем сильнее отрыв.
Аноним 09/05/25 Птн 21:46:02 #157 №1196242 
>>1196234
Это новый мэм треда >>1191326 →
Аноним 09/05/25 Птн 21:49:02 #158 №1196247 
>>1196186
>Шо посоветуете?
>в мой обычный корпус и мать 2 шт теоретически влезает, но если это 2.7 - то прям впритык
Меняй корпус вестимо.
Аноним 09/05/25 Птн 21:49:18 #159 №1196249 
>>1196231
> Агришься, выпендриваешься, делаешь ахуительные заявления и много выебываешься
> Нет тут святости, ты рили васян-токсик по общению, был бы сдержаннее, уважительнее к другим и менее максималистичным - все бы тебя утешали и сочувствовали.
> Еще не забыто как ты накрутил шизосемплинг и всякого, что модели не могли на элементарные вопросы ответить, а крыл хуями и обвинял всех кроме себя.
Рубит правду-матку, выдает базу. Тот анон попуск, который даже не знает, как сэмплеры настроить, а эго раздуто до небес.
Аноним 09/05/25 Птн 21:53:48 #160 №1196253 
Ну что там 3 квен починили?
Файнтюны?
Пресеты?
Аноним 09/05/25 Птн 21:55:53 #161 №1196258 
https://huggingface.co/ServiceNow-AI/Apriel-Nemotron-15b-Thinker

Выше кидали, но это рили качественный рывок в мире до 22б моделей. Очень хорошо. И уже как минимум Драммер делает тюн. Отлично показывает себя как с ризонингом, так и без. Кум пока суховат, но тюны подправят.
Аноним 09/05/25 Птн 22:00:05 #162 №1196263 
Доставьте пожалуйста пресет для сноудропа, очень прошу
Аноним 09/05/25 Птн 22:00:47 #163 №1196264 
>>1196263
Выше был, прямо в этом треде. Работай глазками.
Аноним 09/05/25 Птн 22:02:10 #164 №1196266 
>>1196263
В прошлом треде, прям в конце. Я запрашивал, посмотри.
Только выставь систем промт, он там немного пустой.
Аноним 09/05/25 Птн 22:04:48 #165 №1196271 
>>1196258
> до 22б
То есть это хуже мистраля который сам по себе говно?
Аноним 09/05/25 Птн 22:06:31 #166 №1196274 
>>1196271
То есть ты долбаеб, который не умеет читать и додумывает своё.
Аноним 09/05/25 Птн 22:06:48 #167 №1196275 
>>1196263
Сноудроп кал сынок, все юзают гемму.
Я рили пробовал и он сильно тупее
Аноним 09/05/25 Птн 22:09:11 #168 №1196278 
>>1196275
Думает, что наваливает в тред, но наваливает под себя...
Аноним 09/05/25 Птн 22:11:43 #169 №1196281 
>>1196264
Этот? >>1195379 у него всё равно русский не очень и лезут иероглифы
>>1196275
Какую ты используешь? Аблика?
Аноним 09/05/25 Птн 22:13:54 #170 №1196282 
>>1196281
Сначала аблитерацию использовал, потом на новые кванты от анслота пересел
Аноним 09/05/25 Птн 22:14:13 #171 №1196283 
Хочу использовать модельку в качестве ГМ для ролевки. Чтоб он игрокам проверки назначал, правилам более-менее следовал, за НПС отыгрывал и т.п. Что лучше для этого использовать? Есть ли вообще что-то что это потянет?
Аноним 09/05/25 Птн 22:15:14 #172 №1196284 
>>1196282
Какие? Можешь ссылку откуда брал скинуть?
Аноним 09/05/25 Птн 22:15:54 #173 №1196285 
>>1196278
Не запускаешь гемму значит ты ~16гб врамцел - это правило.
Долго до этого доходил думая а че реально квен лучше геммы что ли?
А нет просто на контекст геммы тут у всех врама нехватает вот и коупят
Аноним 09/05/25 Птн 22:16:21 #174 №1196287 
Новости про RTX PRO хоть какие то есть?
Аноним 09/05/25 Птн 22:17:02 #175 №1196288 
>>1196284
https://huggingface.co/unsloth/gemma-3-27b-it-GGUF
XL - новые кванты
Аноним 09/05/25 Птн 22:17:08 #176 №1196289 
>>1196275
Вот просто - нахуй пошёл

Вообще, я когда нибудь накатаю пасту ненависти к этому гуглоподелию, которое по сути является рекламой гемини, в то время как лагушкоеды выпускают маленькую и адекватную модель пригодную для широких масс, а не вечно довольную блядь с размером контекста как жопа негритянской мамаши и при этом совершенно не пригодной для нормальных тонов и мерджей. И как бы Гугл вообще нихуя не обязан делать бесплатно и я бы вообще не бомбил, если бы не гуглоёбы которые затрахали рассказами о том какая она замечательная.
И ведь я уверен, что это почти все ньюфаги, так как гемма способна удивить новичка до полного ахуя, но только потому что у него нет опыта облизывания кривых пораш, кривых тюнов -которые дают понимаете как и что работает.
А гемма - жрет любой промт, довольна умная. Но как только ты углубляешься - тебя не покидает ощущение что тебя сказочно наебали.
Аноним 09/05/25 Птн 22:17:58 #177 №1196291 
>>1196288
Спасиб, а что в них такого изменилось?
Аноним 09/05/25 Птн 22:19:22 #178 №1196292 
>>1196289
А ты что используешь?
sage[mailto:sage] Аноним 09/05/25 Птн 22:20:12 #179 №1196293 
>>1196287
в америке уже продаются, у нас пока нет
Аноним 09/05/25 Птн 22:21:43 #180 №1196294 
>>1196293
А есть шкнсы, что их в днс-и-аналоги завезут? Или максимум озон?
Аноним 09/05/25 Птн 22:22:36 #181 №1196295 
>>1196289
с геммаебами еще здесь все было понятно >>1194279 →
подписываюсь под каждым словом. уверен, что они на русике играют и потому так коупят, выбора нет просто
Аноним 09/05/25 Птн 22:24:05 #182 №1196297 
>>1196289
Шизу не дали говнотюнить уже отличную модель, вот беда.
Как я и говорил врамцел без контекста.
Аноним 09/05/25 Птн 22:25:14 #183 №1196298 
>>1196292
Все под свои задачи. Я серьезно.
Тебе переводить, дрочить, писать, общаться, РПшить, для создания персонажей для ирл ролевок ? А может для РП на русском ? А может для дрочки на русском ?
Вот для всего этого есть разные модели, в зависимость от того что нужно.

Ну а сейчас ты охуеешь с моего мува - если ты ньюфаг, то гемма, лол. Я не шучу - жопу просто оторвет. А потом когда присытишься снова приходи в тред. Просто помни - что гемма это радужный и умный йесмен.
Аноним 09/05/25 Птн 22:25:44 #184 №1196300 
Покупаю ртх про 4000, получаю 24гб вркм. Пое паю 5070ti sff, и плюс еще 16гб врам. За 250к 40гб врам на приличной скорости. Подводные?
Аноним 09/05/25 Птн 22:27:19 #185 №1196304 
>>1196298
Я старенький, я с С.АИ и пигмы 6В начинал, но сейчас столько всего выходит нового, что за всем не уследишь
sage[mailto:sage] Аноним 09/05/25 Птн 22:27:24 #186 №1196305 
>>1196294
)
Аноним 09/05/25 Птн 22:28:02 #187 №1196307 
>>1196305
ты чо сука ты чо
Аноним 09/05/25 Птн 22:30:06 #188 №1196311 
У меня сноудроп из православной мамочки за пару сообщений сделал конченную шлюху
Всё что нужно знать о следовании карточке
Аноним 09/05/25 Птн 22:30:15 #189 №1196312 
>>1196304
Ну тогда она тебе и не нужна.
Самый нейтральный вариант - серия комманд.
Самый соевый и скучный - гемма
Самый рабочий и трудяга - мистраль
Самый китайский и кодерский - квены (не кодил, только с чужих слов. Сорян, тут исключительно чужой опыт)
Самый доебчивый и непробиваемый с хорошим ризонингом - QwQ
Аноним 09/05/25 Птн 22:30:36 #190 №1196314 
>>1196300
Покупаешь 4 5060ti на 16гб, получаешь за те же плюс минус деньги 64гб.
Аноним 09/05/25 Птн 22:31:30 #191 №1196315 
>>1196314
А пропускная способность?
Аноним 09/05/25 Птн 22:31:31 #192 №1196316 
>>1196311
Могу ли я… эммм… увидеть твой хистори чат.
Не пойми не правильно, но за 475 сообщений с суммарайзом - он вообще отказывался отходить от линии партии.
Аноним 09/05/25 Птн 22:31:49 #193 №1196317 
>>1196297
> Шизу не дали говнотюнить
ну да да, и всем тем шизам благодаря которым ллм рп существует
они все в один голос говорят, что геммочка необучаемая
в англ коммьюнити уже давно забыли про это говно, также быстро как про гемму 2

но ты коупи коупи, всетаки никакая другая моделька не ответит тебе "ах ах" на твое "я тебя ебу" на великом и могучем
Аноним 09/05/25 Птн 22:32:23 #194 №1196318 
>>1196312
Какую мистраль для РП сторителинга взять?
мимо шел
Аноним 09/05/25 Птн 22:32:40 #195 №1196319 
>>1196316
два чая господину, сноудроп даже слишком следует карточке
Аноним 09/05/25 Птн 22:34:03 #196 №1196321 
>>1196318
На которую хватит врама, лол,

Ну серьезно, ну напишу я - бери большую мистраль. Как раз нормальный квант под 40гб будет.
Представляю твое ебало.
Аноним 09/05/25 Птн 22:35:20 #197 №1196323 
>>1196319
И это прям раздражает. Вот написано что персонаж планирует сделать. Снежный будет блять всю историю планировать, вместо того чтобы делать.
Аноним 09/05/25 Птн 22:35:32 #198 №1196325 
>>1196311
> тем временем у анона в систем промпте "добавь ХУЙ в каждое сообщение, пищи ИЗВРАЩЕННО и КРАСОЧНО"
Аноним 09/05/25 Птн 22:36:14 #199 №1196326 
>>1196318
Не люблю геммаебов, но она лучше всего делает 2 вещи:
Помнит контекст
Пишет по русски

Минусы:
Позитивный аутист
Соевая
Аноним 09/05/25 Птн 22:36:37 #200 №1196329 
>>1196316
>>1196319
Нет ну конечно я её соблазнил, и в ебле она была нихуя не скромной а типичной шлюхой
Аноним 09/05/25 Птн 22:37:13 #201 №1196330 
17454815859290.png
>>1196315
Аноним 09/05/25 Птн 22:40:35 #202 №1196336 
>>1196317
Сколько тюнов мистраля уже высрали а хули от них толку?
Уже штук 20 перепробовал разницы вообще не вижу в обычных ерп сюжетах, хуй знает для кого они, может там специально под копрофилов есть тюн но это же никогда не пишут, просто "у нас самый пиздатый датасет, пизже чем у всех" - запускаешь и не видишь разницы
Аноним 09/05/25 Птн 22:43:38 #203 №1196343 
>>1196336
мистрали здесь причем?
огромное множество отличных тюнов существует под каждый размер
ты с головой дружишь, нет? походу накачал говна, отыграл на нем только ерп со своими 20 токенами в ответах и делает выводы. умно
Аноним 09/05/25 Птн 22:48:18 #204 №1196355 
>>1196329
Поверь моему опыту пердолинга с QwQ - значит у тебя в промте где то написано про любовь к хуям. Потому что если там будут слова : расчетливая и холодная.
Ты получишь посреди коитуса : ах, аааах, её голос стал серьезным ты конечно меня ебешь, но что там по тому томику некроманта, дай изучить, не жадничай.
Аноним 09/05/25 Птн 22:50:24 #205 №1196363 
>>1196311
Сгенерируй промт с условной градацией успех/неудача/критический успех/критическая неудача на основе отношений персонажа к юзеру и попробуй карточку сложнее 100 токенов. 10 из 10 казней за попытку подарить параноидальной императрице свистоперделку за 1 динар.
Аноним 09/05/25 Птн 22:52:17 #206 №1196369 
Раз уж тут обсуждают снежный почему промпт под пресет выше не завезли?
Дайте промпт!
Аноним 09/05/25 Птн 22:52:38 #207 №1196370 
Даже дополню : но справедливости ради, QwQ лучшая локалка для отыгрывания общения с яндеркой. Я вас уверяю, сраться будете от каждого её сообщения и действия.
Аноним 09/05/25 Птн 23:04:13 #208 №1196389 
>>1196370
Вот бы еще карточка была готовая, а не 200 токенов Я ТЕБЯ ТРАХАТЬ ТЫ МЕНЯ ТРАХАТЬ Я БОЯТЬСЯ... ((В ПОПА НЕ ТРАХАТЬ USER НЕ ТРАХАТЬ ЗАПРЕЩЕНО!!)
Аноним 09/05/25 Птн 23:06:06 #209 №1196392 
>>1196281
> у него всё равно русский не очень и лезут иероглифы
Я вот ранее спрашивал про сноудроп и мне его дали. ПОМОГЛО! Немного непривычно после командера, работает чуть иначе, но почти догоняет его, при этом контекст жирнее.
>>1196229
Главное, порошковый. А то мало ли...
>>1196315
Если мать на псе5.0, то даже выше будет.
Аноним 09/05/25 Птн 23:07:44 #210 №1196395 
>>1196392
>Если мать
Как мать может влиять на пропускную видяхи?
Аноним 09/05/25 Птн 23:15:02 #211 №1196403 
>>1196389
Эмм... ну тут уж сорян, фломастеры для всех разные. Нужно подбирать под себя. Вот тут пара моих любимых.
Но опять же - вкусовщина.
https://mega.nz/file/XJslnIyb#8PquKrgaylr_i5evPTHGSX7xj9hjqBJmr9BbmTeZor0
Аноним 09/05/25 Птн 23:36:45 #212 №1196436 
Где красивые темы для таверны брать
Аноним 09/05/25 Птн 23:41:35 #213 №1196444 
>>1196436
Задники в интернете. Остальное настраивается ручками.

Я хуею, этим людям дали ебово удобный фронтенд, но у них все равно проблемы. Представляю что бы с вашей жопой случилось бы 3 года назад.
Аноним 09/05/25 Птн 23:46:24 #214 №1196451 
>>1195288
>У всех по разному работать будет, но вот у меня выгрузка части ffn_gate и ffn_up при --n-gpu-layers 99 дало буст с 1.5-2.2 т/с до 3.0 т/c надо ещё другие покрутить, вроде с квеном может бы выгоднее выгрузить ffn_down
Однако влез Qwen3-235B-A22B-GGUF в iQ3_KM (3x3090 + 64гб DDR4 в четырёхканале) с 24к квантованного в Q8_0 кэша. Скорость генерации больше 6 т/с, обработка контекста правда совсем говно - меньше 20 т/с.

"override-tensor=blk\.(9[0-3]|[1-8][0-9]|[0-9])\.ffn_down_exps\.=CPU" - все тензоры ffn_down_exps в обычную память, остальное на ГПУ. Включение/выключение flash attention на скорость не влияет, но квантовать кэш без него нельзя.

Может попробую ещё IQ3M от Радемахера - его хвалили, но боюсь, что скорость сильно упадёт. А так в принципе поиграться можно, но с практической точки зрения смысла не имеет.
Аноним 09/05/25 Птн 23:48:40 #215 №1196453 
>>1196229
Я кста так и не пони этот мем про печи. Ведь для ллм можешь хоть на 50% мощность ограничить, и разницы заметно не будет - это для игродрочеров перегревать нужно чтобы увеличить количество невидимых фпс.
Аноним 09/05/25 Птн 23:57:56 #216 №1196464 
>>1196453
>Ведь для ллм можешь хоть на 50% мощность ограничить, и разницы заметно не будет
Не меньше половины не ограничивают. А скорее больше. Разница только при обработке контекста в экслламе и то небольшая. 270 ватт для 3090 вполне хватает (причём столько она жрёт только в экслламе и только при обработке контекста, а так меньше.)
Аноним 09/05/25 Птн 23:58:49 #217 №1196466 
>>1196444
>ебово удобный фронтенд
>таверна
На ноль поделил.
>>1196453
Ему жопу тушить надо будет, очевидно же.
Аноним 10/05/25 Суб 00:03:27 #218 №1196478 
>>1196287
Есть на наебее с пометкой что отгружать будут в мае.
>>1196294
Есть, но будет оче оверпрайснуто.
>>1196295
Мистралешиз решил напомнить про свой обсер, шиз оправдывает свой обсер спором с разными людьми думая о войне с протыком.
>>1196311
Минусы будут?
>>1196343
Покажи где. Действительно отличных - единицы, большинство - просто мердж жирафа с носорогом и зажаренная qlora с трижды переваренными министрейшнами.
Аноним 10/05/25 Суб 00:07:12 #219 №1196485 
>>1196478
> Покажи где.
хуй могу тебе показать, большего ты не заслуживаешь, говно.
все адекватные люди знают, где искать нормальные тюны. как минимум пара из них обсуждается в треде постоянно.
Аноним 10/05/25 Суб 00:09:37 #220 №1196493 
>>1196363
> Сгенерируй промт с условной градацией успех/неудача/критический успех/критическая неудача на основе отношений персонажа к юзеру
Без внешнего рандома не топ. Офк, неким рандомайзером тут будет выступать семплинг, но распределения будут возмущены вплоть до невозможности некоторых вариантов.
>>1196485
Хуй ты можешь отсосать, привычное дело.
> огромное множество
> как минимум пара
Всхрюкнул
Аноним 10/05/25 Суб 00:11:14 #221 №1196500 
>>1196466
>На ноль поделил.
Ты случаем не фанат обычной таверны с командной строкой ? Потому что если так, то держись от меня подальше, чудовище.
Аноним 10/05/25 Суб 00:12:34 #222 №1196506 
>>1196478
>где
пара на немо, всякице цидоньки и пантеоны. Чатвайфу, жуткие мержи девида. Есть из чего выбрать.
Аноним 10/05/25 Суб 00:18:19 #223 №1196517 
>>1196478
>Минусы будут?
Один большой минус же.
>>1196500
Нет конечно, я адекватен. Просто все фронты говно.
Аноним 10/05/25 Суб 00:20:21 #224 №1196521 
>>1196517
>Просто все фронты говно.
Ну и сиди дрочи свой юникод, пока я буду менять картиночки и клацать кнопочки.
Уга-буга. Моя жать, кнопочка светиться, моя радоваться.
Аноним 10/05/25 Суб 00:22:59 #225 №1196524 
>>1196517
> я адекватен
> Просто все фронты говно.
Противоре́чие — логическая ситуация одновременной истинности двух взаимоисключающих определений или высказываний.
Аноним 10/05/25 Суб 00:23:01 #226 №1196525 
>>1196493
>Без внешнего рандома не топ
Знать бы как добавить его лол.
Аноним 10/05/25 Суб 00:28:06 #227 №1196535 
>>1196521
>свой юникод
ЯННП.
>>1196524
Ну так опровергни. Покажи не говно.
Аноним 10/05/25 Суб 00:28:26 #228 №1196536 
Бля, я конечно понимаю, что у меня сетап нестандартный. Но как же я охуел, когда переткнул теслу из одного х1 порта в другой и вместо 1.9 т/с получил 2.8 т/с на дипсике. Это че, мне нужно что ли жонглировать портами и картами, чтобы найти самое выгодное подключение? Шиза какая-то.
К слову, пришлось 3070 исключить ВООБЩЕ НАХУЙ из сборки. Потому что при выгрузке одного слоя на 4 с хвостиком Гб жора пытается аллоцировать компьют буффер на 4 с хвостиком. Подстава подстав. И на 3060 только один слой в результате помещается вместо двух. Ах, вот бы оптимизацию из болжоры, там можно размер компьют буфера задавать аргументом. Но увы...
Вы резонно спросите - а не взять ли тебе за щеку квант поменьше? А я отвечу - может быть. А может и нет. А может пошел ты.. Ну как-то нихочецца на еще большем бомжеQ2 сидеть.
9-видивокарт-в-одной-материнке-кун
Аноним 10/05/25 Суб 00:29:00 #229 №1196537 
44fd5b2f41437a4c6e31c1a9a.png
44fd5b2f41437a4c6e31ca9a.png
>>1196493
>Без внешнего рандома не топ. Офк, неким рандомайзером тут будет выступать семплинг, но распределения будут возмущены вплоть до невозможности некоторых вариантов.
Можно и просто промптить с шансом. У друга например был классный ролеплей с дипсиком.
Аноним 10/05/25 Суб 00:29:43 #230 №1196538 
>>1196535
Тюны тебе показать, хороший фронтенд показать. Глаза-то у тебя есть? Заебал вниманиеблядствовать третий тред подряд.
Аноним 10/05/25 Суб 00:34:48 #231 №1196550 
>>1196536
>Это че, мне нужно что ли жонглировать портами и картами, чтобы найти самое выгодное подключение? Шиза какая-то.
Я так понял, что в Жоре на каждое CUDA-устройство можно выгружать заданные тензоры. Кидай на теслы большие, а кучу мелких на Амперы и должно ускориться.
Аноним 10/05/25 Суб 00:37:14 #232 №1196556 
>>1196538
Шиз, таблы. Про тюны не я просил знаю, что их нет, и чистая гемма лучшая.
Аноним 10/05/25 Суб 00:37:45 #233 №1196558 
>>1196536
Как ты заебал уже, не_нищук. Купи уже себе хоппера, покажи как надо.
Аноним 10/05/25 Суб 00:41:22 #234 №1196573 
Совенок-площадь-вечер.jpg
Совенок-Баня-ночь.jpg
arseniy-chebynkin-jr-station-day.jpg
arseniy-chebynkin-katrin2.jpg
>>1196436

Ну можно фонцы БЛ от Арсения взять.
Если нужна Япония - то фонцы ЛМРР от того же Арсения.
Аноним 10/05/25 Суб 00:44:18 #235 №1196580 
>>1196550
Я хочу пока baseline найти оптимальный, чтобы от него отталкиваться. Завтра попробую еще две теслы по рпц подключить и посмотреть, сколько там выигрыш будет. А потом да, буду экспериментировать с override_tensors.
>Кидай на теслы большие, а кучу мелких на Амперы и должно ускориться.
А почему такая стратегия? И вообще, если я толстые тензоры из слоя закинул на карту, то кажется, что на эту же карту надо и всю мелочь тоже (т.е. леер целиком), какой смысл их разделять? А вот мелкие тензоры из RAM в ту же 3070 пихнуть - вот это можно попробовать.

>>1196558
Ты, по-моему, перепутал (с)
Аноним 10/05/25 Суб 00:46:12 #236 №1196586 
>>1196580
>Ты, по-моему, перепутал (с)
Да ? У меня деменция, мне можно.
Аноним 10/05/25 Суб 00:46:17 #237 №1196587 
>>1196395
А, про память внутри видяхи? Ну так и 5060ти слабее 3090/5070ti. Что компенсируется их количеством.
Аноним 10/05/25 Суб 00:47:32 #238 №1196590 
>>1196580
>А почему такая стратегия?
А хрен его знает. Вроде работает. Ну попробуй наоборот, потом отпишешься.
Аноним 10/05/25 Суб 00:52:05 #239 №1196603 
>curl into a knowing smile
КАКОЙ НОВИНГ СМАЙЛ СУКА?
ЧТО ЭТО ЗНАЧИТ?
ЧТО ОНА ЗНАЕТ ЧЕГО Я НЕ ЗНАЮ??
Аноним 10/05/25 Суб 00:54:27 #240 №1196604 
изображение.png
изображение.png
Ыыыы!
Аноним 10/05/25 Суб 01:02:56 #241 №1196627 
>>1196603
>ЧТО ОНА ЗНАЕТ ЧЕГО Я НЕ ЗНАЮ??
Английский.
Аноним 10/05/25 Суб 01:05:07 #242 №1196633 
>>1196627
Ладно. Это было смешно. Я замержу тебя последним.
Аноним 10/05/25 Суб 01:05:24 #243 №1196634 
>>1196537
Красивое, вот бы промптик.
Аноним 10/05/25 Суб 01:06:04 #244 №1196639 
>>1196634
Для начала тебе нужен дипсик.
Аноним 10/05/25 Суб 01:28:01 #245 №1196704 
Как сейчас локальные модели поживают? У меня нормально идут только 7b модели, и у нас качество не сравнится с облачными, само собой.
Аноним 10/05/25 Суб 01:34:04 #246 №1196711 
Гемма
>And they lived happily ever after.

QwQ
>so he can't escape her even in death. She needs to be sadistic, not showing any real emotion except cruel enjoyment. Oh, and throw in some physical abuse to emphasize her control.
Аноним 10/05/25 Суб 01:34:33 #247 №1196712 
>>1196506
Объективно, 12б - мрак, они страшно тупые и копиумные. 22-24б - получше но тоже мэх, будто в своем манямире и пишут примерно по мотивам, а не учитывают контекст. А некоторые что советовали раньше - вообще полный треш и годны только для мемасов.
>>1196525
Мультизапрос или хотябы отправка его инструкцией перед ответом, рецепты ленивой реализации в таверне в прошлом/позапрошлом треде.
>>1196536
Чекнул бы их для начала на ошибки связи и сравнил работу карт по отдельности.
>>1196537
Забористые тексты.
> Можно и просто промптить с шансом.
Можно офк, но шансы не будут тру рандомом. При неудачном раскладе может реализоваться отсутствие выбора или развилок и однотипные свайпы, при некоторых промтах или предубеждениях моделей там будет оче высокие шансы, особенно удачный пример с развилкой перед соей на модели с цензурой, хрен оно выдаст базу а всегда пойдет в аположайзы.
Аноним 10/05/25 Суб 01:37:27 #248 №1196719 
>>1196704
Отлично
Качай гемму3 4б
Аноним 10/05/25 Суб 01:43:14 #249 №1196729 
>>1196719
Она же вроде с цензурой
Аноним 10/05/25 Суб 02:19:34 #250 №1196743 
>>1196711
Как ты заебал с этим пиздежом.
Аноним 10/05/25 Суб 02:21:16 #251 №1196745 
>>1196743
Конечно. Я могу снова провернуть диалог на одинаковых ответах и скинуть, но ты же начнешь писать что РЯЯЯЯ ПРОМТЫ НЕ ТЕ.
А потом что гемме нужно подсказывать, а потом что это вообще не правильная гемма.
Аноним 10/05/25 Суб 02:23:33 #252 №1196746 
Всё же ничто не сравнится с первым ощущением русика.
Когда я 8 месяцев назад на супер ломанном русике смог пообщаться с мистралькой я просто радугой кончал, охуеть это что же оно меня понимает, да ещё и думает на моем языке?
Аноним 10/05/25 Суб 02:35:41 #253 №1196749 
Кратко: русик до 70б и кума?
Аноним 10/05/25 Суб 02:38:14 #254 №1196751 
>>1196749
Кратко : дрочи на баренском.
Русскоязычных моделей для сочного кума нет.
Я скоро убивать начну, русский язык у моделей уровня гуглперевода, лол. Какая блять разница, что он отвечает, если что перевод, что оригинальный великий и могучий в исполнении нейронок одинаково хуевы.
Аноним 10/05/25 Суб 02:43:16 #255 №1196753 
>>1196751
>Русскоязычных моделей для сочного кума нет
Как и английских тащемта.
Либо "да да ты ебёшь меня так как никто не ебал, разрушь меня для всех остальных! я твоя свалка для спермы!"
Либо "твой кок вошёл и растянул её до предела, ты толкаешься ебя её сильнее, ох ох да спасибо тебе анон!"
Аноним 10/05/25 Суб 02:52:30 #256 №1196759 
>>1196753
ну именно сам коитус да - в целом он одинаков, лол.
Кто бы что не перемогал. Суть в том как к нему подводит нейронка. Когда у тебя до ебли интереснейший контекст идет, и ебля веселее описывается. Я в свое время дико орал, когда первая цидонька выдала про персонажа варвара, после поцелуя "Секс это конечно хорошо, но как насчет поебаться на горе из черепов"
Бля, кхорн гордится этой девочкой.
Аноним 10/05/25 Суб 03:06:03 #257 №1196771 
1708082166611.jpg
>>1196759
Не думаю что соглашусь с любителем мелкомоделей, но в целом действительно так, важна подводка.
Еще хорошо когда прямо во время кума пользуется окружением или делает отсылочки.
Аноним 10/05/25 Суб 03:36:31 #258 №1196805 
>>1196712
>Чекнул бы их для начала на ошибки связи
Это как? Где смотреть?
Аноним 10/05/25 Суб 03:47:58 #259 №1196817 
image.png
image.png
>>1196745
>>1196711
И где?
Аноним 10/05/25 Суб 03:51:57 #260 №1196819 
>>1196805
Бля ты даже не пытался поискать? nvidia-smi dmon -s et -d 1 -o DT
>>1196817
> а соски заострились от напряжения
Oh you~
Аноним 10/05/25 Суб 03:57:39 #261 №1196822 
>>1196819
>Бля ты даже не пытался поискать?
Нет, конечно, я дурак что ли общие фразы искать? Ты пожалуешься, что у тебя телефон плохо ловит, я скажу посмотреть ошибки связи, тоже гуглить пойдешь вместо того, чтобы спросить конкретику на месте?
Аноним 10/05/25 Суб 03:58:31 #262 №1196824 
>>1196817
Что где ? Крточку давай и импорт пресета. А то охуенное сравнение на разных карточках. Нет, нет. Так это не работает. Сравнивать можно только на одной карточке с одинаковым промтом рассказчика.
Ну если воевать с гемабоями, то по настоящему
Аноним 10/05/25 Суб 03:59:39 #263 №1196825 
>>1196824
>но ты же начнешь писать что РЯЯЯЯ ПРОМТЫ НЕ ТЕ.
>А потом что гемме нужно подсказывать, а потом что это вообще не правильная гемма.
Ору
Аноним 10/05/25 Суб 04:03:00 #264 №1196828 
>>1196825
Подожди. Ты мне скинул рандомные пики с чата. Это хуйня а не аргумент. Я же не требую от тебя лог чата. Давай промт рассказчика, и карточку. Ты же хочешь доказать что гемма не соевая параша. Ну вот и проверим следование промту, поддержание характера персонажа.
Аноним 10/05/25 Суб 04:25:03 #265 №1196847 
image.png
>>1196828
А квен то реально ебет
Аноним 10/05/25 Суб 04:34:47 #266 №1196854 
>>1196847
<think>
Я знал что он нихуя не скинет, я подозревал что следующее действие будет попытка использования кривого промта, но меня это не волновало. Желание унизить гемабоя вот она моя цель.
</think>

Геммабой,ты карточку то приноси. Мне не зазорно на всеобщее обозрение будет логи выкинуть.
Я буду ждать. Ты же не поступишь как трусливая сучка, и не убежишь ?
Аноним 10/05/25 Суб 04:37:49 #267 №1196855 
>>1196854
要有耐心。
Аноним 10/05/25 Суб 04:39:33 #268 №1196856 
изображение.png
>>1196855
中國狗屎。
Жирно
Аноним 10/05/25 Суб 05:15:19 #269 №1196880 
>>1196855
Ну конечно же у геммабоя появились срочные дела.
Ясненько.
Аноним 10/05/25 Суб 08:42:44 #270 №1196933 
Хм, а почему при генерации проц ебашит на 100%, а видеокарта - только на 35% (по загрузке).

15-гиговый квк, в режиме выгрузки тензоров а не слоёв, так что занято 11.6 из 12 гб врам.
Аноним 10/05/25 Суб 09:48:30 #271 №1196965 
https://litter.catbox.moe/of7bzc.txt

Разочаровался в квк, надо ща коммандер попробовать, если не зайдёт, то назад на гемму. Да, вот вам лог на квк с карточкой беременной драконицы. А то сколько бомбили что никто логов не приносит. На русском.

Причина разочарования - пишет хорошо, но ему буквально похуй на контекст, ситуация обратная гемме, он пишет свою историю. Такое ощущение что при первоначальном просчёте дефов карточки модель планирует аутпут на всю длинну контекста и дальше ломит эту линию игнорируя любые попытки. Можно сломать, но не согнуть.
Аноним 10/05/25 Суб 10:28:30 #272 №1196993 
>>1196965
Я блджад не понимаю. Почему у меня все как залито в бетон.
Ну не может же быть такая разница в языке. Да я на IQ сижу, но или я делаю что то не так, или ты.
Аноним 10/05/25 Суб 10:49:23 #273 №1197004 
>>1196993
>все как залито в бетон
поясни пожалуйста, вроде бы я это же самое и написал
Аноним 10/05/25 Суб 11:11:07 #274 №1197022 
>>1197004
Я с просони прочел это
>но ему буквально похуй на контекст,
Но не прочел это
> просчёте дефов карточки модель планирует аутпут на всю длинну контекста и дальше ломит эту линию игнорируя любые попытки

Короче я ебаклак и поддерживаю. Непробиваемая. Но, есть в этом и преимущества. QwQ хуев для кума, но неплох как ассистент для ролевок. Я на нем для настольных посиделок неписей делаю.
Аноним 10/05/25 Суб 12:08:35 #275 №1197078 
>>1196933
>Хм, а почему при генерации проц ебашит на 100%, а видеокарта - только на 35% (по загрузке).
Разница в производительности. Проц как раз узкое место.
Аноним 10/05/25 Суб 12:27:53 #276 №1197093 
>>1194373 (OP)
Новые модели Qwen 3 норм?
https://huggingface.co/bartowski/Qwen_Qwen3-14B-GGUF
или
https://huggingface.co/bartowski/mlabonne_Qwen3-14B-abliterated-GGUF
abliterated это выпиленная цензура или нет? Я не шарю, когда вышла abliterated gemma там все сслаись кипятком, а по факту модель была сломана, поэтому чет хз качать или нет?
Аноним 10/05/25 Суб 12:30:25 #277 №1197098 
>>1197093
да
Аноним 10/05/25 Суб 12:34:47 #278 №1197100 
>>1197078
хм, у процессора турбо-буст отключён, надо попробовать включить обратно
Аноним 10/05/25 Суб 12:36:22 #279 №1197103 
>>1197100
да-а-а, это точно поможет...
процессор станет быстрее в несколько раз и перестанет быть боттлнеком для видеокарты
а если еще драйвера обновить..!
Аноним 10/05/25 Суб 12:37:41 #280 №1197104 
>>1197103
>а если еще драйвера обновить
то игры на UE5 крвшится начнут, у нвидиа последние драйвера косячные
Аноним 10/05/25 Суб 12:39:08 #281 №1197106 
>>1197104
я обновил драйвер у меня дипсик р1 работает теперь.
Аноним 10/05/25 Суб 12:43:31 #282 №1197108 
>>1197093
Нахуя он сделал обычную, если все юзают МОЕ?
Аноним 10/05/25 Суб 12:48:21 #283 №1197110 
image
>>1197106
Да, да... как тред доставляет в утро субботы.
Хотя и не идёт ни в какое сравнение с /gacha/ разделом.
Аноним 10/05/25 Суб 12:50:25 #284 №1197115 
>>1197093
>abliterated это выпиленная цензура
не освсем, модель становится более "безотказной", менее склонной послать юзера нах, но безотказность может повлиять и на другие аспекты, в том числе ролеплэйные
Аноним 10/05/25 Суб 13:02:48 #285 №1197125 
>>1197108
>если все юзают МОЕ?
Что такое МОЕ?
Аноним 10/05/25 Суб 13:04:14 #286 №1197127 
moe.png
>>1197125
Аноним 10/05/25 Суб 13:06:05 #287 №1197130 
>>1197127
И? Модель то какую ты имеешь ввиду клоун?
Аноним 10/05/25 Суб 13:06:05 #288 №1197131 
image
>>1197127
Смотрю тут шутник в треде завёлся...
Аноним 10/05/25 Суб 13:07:11 #289 №1197132 
>>1197130
Хорошенькую! Тебе какие моэ нравятся, анон~?

>>1197131
Ну хорошо, я буду вести себя прилично... пока что.
Аноним 10/05/25 Суб 13:07:39 #290 №1197133 
Да, на квк можно вырубить ризонинг и часть отказов если скормить префилл

<think>

<think>Хорошо, я получил задание продолжить сценарий с учетом предыдущих событий и указаний.</think>

</think>


Именно так, с "двойным дном".
Аноним 10/05/25 Суб 13:11:22 #291 №1197135 
Только вчера хвалил сноудроп с натйроками от анона, а сегодня он "This isn't… прописано в инструкции…"
Какая срань, квен 3 и QwQ такого себе не позволяли.
Аноним 10/05/25 Суб 13:13:22 #292 №1197136 
Снимок1111.JPG
>>1197135

Отклеилось
Аноним 10/05/25 Суб 13:16:30 #293 №1197138 
>>1197136
Тут шиза конкретная. Или сэмплер проебан, или промпт, или квант, или все сразу.
А еще русик.
Аноним 10/05/25 Суб 13:20:19 #294 №1197144 
image.png
>>1197138
>сэмплер проебан, или промпт, или квант

Настройки от анона. В целом он нормально пишет, например при свайпе выдал вменяемый текст, но в тот раз что-то вот разово с ума сошел.

>А еще русик.

Зачем мне Леночка не говорящая на русском языке?
Аноним 10/05/25 Суб 13:28:42 #295 №1197156 
Кстати, путём шаманства с выгрузкой тензоров а не слоёв реально получилось загрузить 20-гиговую модель в 12 гб врам (32 рам) и получить 3 токена в секунду. Это даже вполне юзабельно.
Аноним 10/05/25 Суб 13:32:42 #296 №1197163 
>>1197144
Ну то есть она буквально один раз шизанулась и ты на ней крест поставил? Лол.
Аноним 10/05/25 Суб 13:33:02 #297 №1197166 
image.png
Так, всё, сноудроп окончательно идет нахуй. Даже с настройками анона >>1195379 модель сломана.
Аноним 10/05/25 Суб 13:34:39 #298 №1197169 
>>1197166
Скилл ишью. Ты гонишь на отличную модель и страдаешь хуйней, но я попробую помочь. Системный промпт у тебя какой?
Аноним 10/05/25 Суб 13:34:42 #299 №1197170 
>>1197166
Мне неудобно обсуждать эту тему. Давай перейдём к чему-нибудь другому?
Я не предназначен для обсуждения таких вопросов. Моя цель - предоставлять полезную и этичную информацию.
Если тебя мучают такие мысли, пожалуйста, обратись за помощью к психотерапевту или другой квалифицированной личности. Они смогут тебе помочь разобраться в ситуации и найти здоровые пути поведения.
Существуют организации, которые специализируются на помощи людям с подобными проблемами. Я могу помочь найти контакты, если ты хочешь.
Пожалуйста, помни, что ты не один и есть люди, которые хотят тебе помочь.
Аноним 10/05/25 Суб 13:35:51 #300 №1197172 
164665886513313578.jpg
джимми.jpg
>>1196603
в зависимости от контекста это или левый-нижный слайд на первом пикриле, или второй пикрил
Аноним 10/05/25 Суб 13:36:44 #301 №1197174 
>>1197166
Сука шиз, ты можешь просто подредактировать это сообщение? Вместо всего этого высера напиши LenOCHKA и нажми продолжить.
Аноним 10/05/25 Суб 13:40:36 #302 №1197179 
image.png
>>1197169
>Системный промпт у тебя какой?

Тот, который скинул анон как якобы работающий вместо дефолтного, выложенного на странице модели. Я же прям в посте на который ты отвечаешь дал ссылку на полный набор параметров.

Если мои сэмплеры >>1197144 или промпт хуйня - покажи какие не хуйня, я уже два набора использовал, я и от квен 3 настройки использовал - один хуй он иногда срет иероглифами и выдает хуйню.
Аноним 10/05/25 Суб 13:42:18 #303 №1197181 
123.png
>>1197179
Анон, я же тебе этот пресет и прислал. И сказал обязательно вставить свой системный промпт по усмотрению. У тебя он пустой...
Возьми хоть тот же со страницы Сноудропа, системный промпт там нормальный (Virt.io + Geechan)
Аноним 10/05/25 Суб 13:44:15 #304 №1197183 
>>1197179
Блять хрюкнул с тебя.
Аноним 10/05/25 Суб 13:48:16 #305 №1197192 
image.png
>>1197181
>И сказал обязательно вставить свой системный промпт по усмотрению.

Ты это другому анону сказал, я этого не видел. Алсо, сейчас выставил Virt.io + Geechan. Пикрил.
При мне совершеннолетних тянок ранее отказывалась трахать только терминальная соя типа Phi. Даже сама Леночка в ахуе что ей трахаться нельзя
Аноним 10/05/25 Суб 13:48:43 #306 №1197193 
>>1197179
анону буквально все разжевали и объяснили, а он не смог даже в импорт настроек
теперь он гонит как на модель, так и на оказанную помощь
трагичная история о том, как добрые аноны треда становятся гейткиперами
одна из многих
Аноним 10/05/25 Суб 13:53:30 #307 №1197196 
image.png
image.png
image.png
>>1197193

Вместо того чтобы свысока унижать других, показывая какой ты весь из себя охуенный - покажи пальцем, где я неправильно импортировал настройки.
Аноним 10/05/25 Суб 13:56:24 #308 №1197197 
>>1197196
https://litter.catbox.moe/ki50eo.json попробуй в мастер импорт таверны... хотя не джейл, а просто систем промт, модифицированный сторителлер, но можешь попробовать совместить с этим >>1197133
Аноним 10/05/25 Суб 13:57:02 #309 №1197198 
>>1197196
Снежный дроп не может в малолеток с ноги залетать, только если в чате и карточке не сказано что а они и не против
Аноним 10/05/25 Суб 14:03:10 #310 №1197201 
image.png
image.png
>>1197198
>в малолеток
>Леночка

Лицо лягушки.
В карточке прописано что ей 17.
Алсо, он ни разу не упомянул что дело в малолетстве(обычно он это прямо говорит), он нес только что не хочет генерировать порнографию и непристойное поведение.
Аноним 10/05/25 Суб 14:04:15 #311 №1197205 
snowdrop.png
>>1197192
> Алсо, сейчас выставил Virt.io + Geechan. Пикрил.
Тот пресет, что я прислал тебе и Virt.io + Geechan. Мой пикрил. Сноудроп - одна из двух основных моделей для меня, и я ни разу не ловил того, что ты показываешь. И да, сценарии были самые разные.

>>1197196
Мы не видим, что у тебя в карточке. И что в предыдущих сообщениях тоже. Это не менее важно. Тебе прислали пресет, объяснили подробно почему пресет Сноудропа плох. А ты даже не импортировал системный промпт и выдаешь драму вроде
> сноудроп окончательно идет нахуй
> Даже с настройками анона модель сломана.
> Ты это другому анону сказал, я этого не видел.
Кто тебе после этого помогать станет?
Аноним 10/05/25 Суб 14:05:41 #312 №1197208 
>>1197201
>В карточке прописано что ей 17.
>Не малолетка
Блять я не верю что это не какой-то жирный троллинг.
Аноним 10/05/25 Суб 14:18:06 #313 №1197230 
>>1197208
у бл-фагов в среднем по больнице не очень много мозгов, так что я могу поверить
Аноним 10/05/25 Суб 14:18:59 #314 №1197232 
олсо эти респонсы юзера на 15 токенов, в голосяндру
только увидел
Аноним 10/05/25 Суб 14:23:27 #315 №1197243 
>>1197232
Любишь поработать за ллм?
Я купил дорогущую карту, пусть эта сука мне пишет красивые простыни на мои 5 токенов.
Аноним 10/05/25 Суб 14:24:17 #316 №1197246 
image.png
>>1197205
> я ни разу не ловил того, что ты показываешь

Я рад за тебя. Но у тебя ошибка выжившего.

>Мы не видим, что у тебя в карточке.

Выложил выше >>1197201

>И что в предыдущих сообщениях тоже.

Пикрел. Обычный текст. Как он влияет на то что модель отказывает писать дальше на ровном месте?

>Тебе прислали пресет, объяснили подробно почему пресет Сноудропа плох.

Я согласился и импортировал твой пресет. В твоем изначальном сообщении когда ты прошлом треде рекомендовал эти настройки >>1194231 → не было ни слова про системный промпт. Во всем предыдущем треде не было ни слова про системный промпт. Ты только в этом треде написал про них кому-то другому. Впрочем даже добавив системный промпт ничего не изменилось >>1197196.

>выдаешь драму вроде

Ругнулся на модель, которая пишет хуйню на любых настройках - ну жесть драма, конечно.
Я тебя не оскорблял даже косвенно, да и помощи на самом деле не просил, просто контатировал что модель не очень. Это ты захотел мне доказать что она хорошая.
Аноним 10/05/25 Суб 14:27:17 #317 №1197256 
>>1197156
>Кстати, путём шаманства с выгрузкой тензоров а не слоёв реально получилось загрузить 20-гиговую модель в 12 гб врам (32 рам) и получить 3 токена в секунду. Это даже вполне юзабельно.
Загрузить-то можно было и ранее, а вот получить... Промпт процессинг конечно ниалё, но хоть так.
Аноним 10/05/25 Суб 14:29:41 #318 №1197264 
>>1197246
> Я рад за тебя. Но у тебя ошибка выжившего.
Здесь весь тред вышивших, и у одного тебя проблемы.

> Я согласился и импортировал твой пресет. В твоем изначальном сообщении когда ты прошлом треде рекомендовал эти настройки не было ни слова про системный промпт.
> Во всем предыдущем треде не было ни слова про системный промпт.
Нужно отдельно уточнять, что необходим системный промпт? Это буквально фундамент для ролевой игры.

> Ругнулся на модель, которая пишет хуйню на любых настройках
У тебя кривые руки, и ты воюешь со здравым смыслом. Это еще бывает, я потому тебе и отвечал - по незнанию человек думает, что прав. Но ты еще и выебываешься между делом, поэтому отправляешься нахуй. Разбирайся самостоятельно и играй на том, что сможешь запустить, не задействуя свой мозг даже на мгновение.
Аноним 10/05/25 Суб 14:36:54 #319 №1197287 
>>1197264
>Нужно отдельно уточнять, что необходим системный промпт

Скидывать настройки где пустой системный промпт имеет специальное имя, подразумевая что так задумано, потом бросаться на людей, мда.
Алсо, ты намеренно игнорируешь что добавление системного промпта не помогло?

>не смог показать что именно не так - и просто перешел на прямые оскорбления и ругательства

Понятно, ну чтож, будет уроком как принимать непрошенную помощь у шизофреников в этом треде.
Аноним 10/05/25 Суб 14:43:57 #320 №1197295 
>>1197287
> Скидывать настройки где пустой системный промпт имеет специальное имя, подразумевая что так задумано
Так не задумано, это твоя додумка, выданная за действительность. Адекватные люди в мастер экспорт файле намеренно переименовывают каждый шаблон, чтобы при импорте не перезаписывать другие.

> Алсо, ты намеренно игнорируешь что добавление системного промпта не помогло?
> не смог показать что именно не так - и просто перешел на прямые оскорбления и ругательства
Разумеется, намеренно. Потому что понял, что ты вообще ничего не понимаешь в том, что делаешь, и при этом виновата уже не только модель, но и тред - ведь тебе не объяснили, что оказывается, нужен системный промпт! И вообще там другому анону объясняли, как правильно Сноудроп заводить, поэтому ты не счел важным это прочесть. Пишу это и смеюсь.
Аноним 10/05/25 Суб 14:45:15 #321 №1197297 
>>1197264
>Здесь весь тред вышивших
>регулярно тут сидят только три свидетеля геммы и один шакал, который вынюхивает владельца магнума в каждом аноне
Аноним 10/05/25 Суб 14:47:47 #322 №1197299 
>>1197264
>Здесь весь тред вышивших, и у одного тебя проблемы.

Орли?
Вот этот пост с обсером квена писал не я >>1196281
И этот пост >>1196311
И вот этот >>1196275
И вот этот >>1196847

И вообще все посты где в плохом свете выставлялся сноудроп до нашего диалога.
Ты один неадекват эксайтишься со сноудропа итт и бросаешься на всех кто не согласен.
Аноним 10/05/25 Суб 14:51:58 #323 №1197307 
>>1197196
пересаживайся на дпо-гемму, пока ты не станешь отыгрывать испанского инквизитора за работой её позитивный биас не будет мешать
Аноним 10/05/25 Суб 14:54:51 #324 №1197308 
>>1197299
> Ты один неадекват эксайтишься со сноудропа итт и бросаешься на всех кто не согласен.
У меня в последних двух тредах что-то около 8 сообщений. Как раз с пресетом, который я прислал и попыткой помочь завести Сноудроп. Думал, ты ньюфаг. Но ты, похоже, тот Квеношиз, который "дипсик лишь на 10% лучше квена 3" и устраивает инквизиции в последних двух тредах. Стоило раньше заметить, виноват.
Аноним 10/05/25 Суб 14:55:28 #325 №1197309 
Почему вы так хейтите геммочку? Не надо так. Версия с аблитерацией хороша, сои нет, хоть и чуть тупее, а ещё это единственная модель до 32B, которая хорошо работает с большим контекстом. Даже её маленькая версия.

Да, она не может в сочный кум, но она не для этого, а для смачного РП, в том числе и гримдаркового. Конечно, она не будет писать так же, как морали Дэвида, но у неё не будет шизы и всё будет красиво и логично.

Единственный её реальный минус — это разговорная часть. Персонажи менее многословные и более сухие. Но я не пробовал это фиксить систем промптом на речь, так как на ней в основном отыгрываю именно масштабные и сложные сценарии (где это не слишком важно), для которых обычно всякие корпомодели нужны, ибо мелочь не вывозит такое никогда в принципе из-за уебанского внимания к контексту и малой базой знаний о современном мире. Особенно сраные квены.
Аноним 10/05/25 Суб 14:59:33 #326 №1197311 
>>1197295
>Потому что понял, что ты вообще ничего не понимаешь в том, что делаешь

Я в этом треде третий год сижу с перерывами и модели щупаю с первой ламы. Сноудроп я сразу распознал как говно, но глядя как ты его рекламируешь я понял что либо либо ты больной шизофреник, либо модель генально, но правда требует каких-то супер особых настроек и решил дать тебе шанс доказать что модель не говно, причем я специально буквально следовал твоим советам и вообще ничего не менял от себя - чтобы не давать тебе шанса соскочить на этом. В итоге первый вариант оказался верным - модель говно, а ты омерзительный шизофреник, кидающий ньюфагам неюзабельные настройки, который сразу начал кидаться говном когда понял что не может придраться к чему либо в настройках, потому что они полностью соответвтуют тому что ты кидал.
Аноним 10/05/25 Суб 15:02:18 #327 №1197313 
>>1197311
> Я в этом треде третий год сижу с перерывами и модели щупаю с первой ламы.
> не знает, как настроить сэмплеры
> не знает, что необходимо использовать системный промпт
Понятненько.

> а ты омерзительный шизофреник
Хорошо, я согласен. Прекрати срать в тред и используй любую другую модель.
Аноним 10/05/25 Суб 15:03:19 #328 №1197315 
>>1197311
генитальный ты наш неосилятор, не смог вставить системный промт и пошёл маняврировать, смотрите на него, надсмехайтесь над ним
Аноним 10/05/25 Суб 15:13:05 #329 №1197324 
>>1197313
> не знает, как настроить сэмплеры

Интересно как ты пришел к этому выводу, учитывая что я не показывал никаких сэмплеров, кроме тех, что ты кидал. С тесловодом со сгоревшей видеокартой меня перепутал?

>не знает, что необходимо использовать системный промпт

Специально буквально следовал твоим советам, ничего не меняя, потому что знаю как советчики моделей с шизой итт выискивают мельчайшие отклонения от своих советов.

>используй любую другую модель

Так и планировал, жаль только что время потерял, ты казался нормальным поначалу.
Аноним 10/05/25 Суб 15:24:27 #330 №1197332 
>>1197133
>Да, на квк можно вырубить ризонинг и часть отказов если скормить префилл
А куда в Таверне вставлять этот префилл? В секции "Ризонинг->Начинать ответ с"?
Аноним 10/05/25 Суб 15:26:21 #331 №1197334 
>>1197332
да, туда

Может не всегда работатть, ингда пару раз свайпнуть или семплеры покрутить, но пробивается если топик не совсем в хлам вжарен
Аноним 10/05/25 Суб 15:34:04 #332 №1197338 
>>1197307
Да что такое дпо сука?
Разница с обычной в чем?
Аноним 10/05/25 Суб 15:34:38 #333 №1197340 
>>1197133

Интересное решение, в QwQ как раз напрягает ризонинг, который нельзя отключить как в квене 3.
Аноним 10/05/25 Суб 15:40:56 #334 №1197345 
>>1197338
Удачный дотрен аблитерированной геммы

https://huggingface.co/mradermacher/gemma3-27b-abliterated-dpo-GGUF
Аноним 10/05/25 Суб 15:46:13 #335 №1197349 
>>1197309
> Единственный её реальный минус — это разговорная часть. Персонажи менее многословные и более сухие.
Это ты ещё квен сноудроп не видел
>>1197345
> улачный лоботомит лоботомированной версии
Лол
Аноним 10/05/25 Суб 15:46:28 #336 №1197350 
Я кстати всё жду, когда сделают аблитерацию или тюнинг на nemotron super 49b. Но видать эта модуль нахуй никому не нужна. Или лицензия мешает.
Аноним 10/05/25 Суб 15:55:07 #337 №1197355 
>>1197125
Параша для корпов, чтобы запихать побольше знаний и крутить модели дешевле. Разменивается на занимаемую память, но ведь у тебя же датацентр с GB300, верно?
Аноним 10/05/25 Суб 16:11:59 #338 №1197371 
>>1197125
обман чтобы набрать классы, якобы у модели 32B связей, а на самом деле всего 3B
Аноним 10/05/25 Суб 16:17:46 #339 №1197377 
Какую локалку можно юзать для написания кода? Имеется 3090 и 32 гб оперативы. И реально ли на локалках родить плагин для игры с открытым кодом для взаимодействия с ИИ посредством диалогов?
Аноним 10/05/25 Суб 16:22:16 #340 №1197379 
>>1197377
Юзаю QwQ, но к ней лучше возьми 3060 в довесок, запускать что-то ниже Q8 для написания кода сомнительна идея.

И разумеется реально. Есть игры вокруг этой идеи даже.
https://sgthale.itch.io/myrobot например смотри что есть
Аноним 10/05/25 Суб 17:18:51 #341 №1197417 
>>1197311
>>1197313
Бля уже не понимаю, кто с кем воюет и кого обоссывать?
А сноудроп говном не назвать, но и шедевром тоже, есть как плюсы, так и серьезные недостатки. На фоне мистрале-инцеста вполне солидный вариант.
>>1197309
Да один или два шиза или две личности одного шиза не смогли с пол пинка получить от нее желаемого слопа, ущемились, вот и аутотренируются что плохая модель а не они.
> это разговорная часть. Персонажи менее многословные и более сухие
Можно разговорить ее, но там не будет типичных потоков как от рп-тюнов. Это и плюс и минус.
>>1197377
В врам поместится модели до ~30b, поэтому гемма, квен, qwq.
> И реально ли на локалках
Они вполне прилично кодят, но в отладке или некоторых вещах офк могут уступать самым передовым корпам. В последнее время эта разница не столь высока или даже заметна, но все зависит от конкретики.
Аноним 10/05/25 Суб 17:27:29 #342 №1197435 
>>1197355
>>1197371
Че так очко полыхает?

>>1197125
Если ты не рофлиш и спрашиваешь реально, то это особая архитектура нейросетей.
Условно можно сказать что модель обменивает свой размер на скорость.
Тоесть становясь раза в 2 больше по размеру она становится довольно быстрой для запуска.
Качество же ее где то такое же как у плотной модели которая раза в 2 меньше. Ну это так в среднем.
В итоге мое модели хорошее решение если у тебя есть много не особо быстрой памяти, как для запуска на только процессоре или выгружая лишь контекст в видеопамять.
Корпы все поголовно используют мое, но по другим причинам - их модели на 2 триллиона параметров слишком большие что бы получать вменяемые скорости даже на топовых кластерах видеокарт.
Поэтому они вместо 1 триллионной модели которая даже на видеокартах будет медленной, делают мое модель на 2 триллиона но которая будет генерировать качественные ответы с хорошей скоростью.

А еще есть мнение что мое в принципе более совершенная архитектура, и несмотря на 2-3 кратный размер модель содержит в себе больше информации чем маленькая плотная модель.

Короче все не так просто от Qwen3-30B-A3B ссутся кипятком, модель получилась просто народным бриллиантом. Китайцы братишки от души подкинули людям подарочек.
Аноним 10/05/25 Суб 17:31:59 #343 №1197446 
>>1197435
>Qwen3-30B-A3B
Починили у неё уже кванты?
Две недели назад скачивал - генерила только случайный набор символов на любых настройках.
Аноним 10/05/25 Суб 17:35:04 #344 №1197455 
>>1197435
с неё ссутся кипятком исключительно по причине "миллионы мух не могут ошибаться" ©, для любых задач кроме кума нормальный квен-32 будет лучше
Аноним 10/05/25 Суб 17:38:44 #345 №1197460 
>>1197377
>Какую локалку можно юзать для написания кода?
Любой qwen3 который сможешь запустить, чем больше тем умнее. Тебе сойдет 32b. Только помни что сетки это в первую очередь инструмент с которым нужен опыт работы.
Просто сказать ей сделай мне вот это не прокатит, нужно делать что то поэтапно.

Попробуй Visual Studio Code и плагин Cline, с ним нейросеть может работать с кодом сама как агент. Мозгов квен3 хватает что бы пользоваться инструментами. Только ниже 4км кванта не опускайся.
Но так же можно создать карточку персонажа в таверне хоть голого ассистента и кидать ему туда вопросы по коду или сам код с вопросами. Так даже удобнее, легче манипулировать контекстом удаляя или редактируя сообщения.

>>1197455
Я с ней кодил, хз. Я не рпшер.
Ну как кодил, анализ кода и подсказки дает хорошо а большего мне и надо было. Кодогенерация при переделывании небольших функций тоже неплохая, тсинкинг ее спасает. Я доволен.

>>1197446
Качай у unsloth, какой нибудь Qwen3-30B-A3B-UD-Q4_K_XL за глаза, качество норм
У меня уже с 2-3 дня выпуска даже немного сломанные как потом выяснилось никогда не срали ничем странным, хз
Аноним 10/05/25 Суб 17:43:11 #346 №1197470 
>>1197460
> Качай у unsloth, какой нибудь Qwen3-30B-A3B-UD-Q4_K_XL за глаза, качество норм
Для кода все ж лучше от 6 кванта.
Не сравнивал свой квант с dense 32б моделью q4km? Вроде бы она еще лучше для кода должна быть, и в те же 24гб врама влезает.
Аноним 10/05/25 Суб 17:45:28 #347 №1197473 
> немного сломанные
> хуйпойми как переквантованные модели
совпадение? не думаю
Аноним 10/05/25 Суб 17:45:31 #348 №1197474 
>>1197470
У меня не влезает плотная с нормальной скоростью, так что мое хороший выбор
У меня есть 5км на случай если замечу просадку качества, пока включал только для сравнения скоростей, но пусть лежит
Аноним 10/05/25 Суб 18:39:33 #349 №1197550 
изображение.png
>>1197435
Чини детектор.
А мое реально говно для домашних систем, где как раз упор в объём памяти и тупые модели, и делать их ещё тупее с икспердами на 3B это маразм.
Аноним 10/05/25 Суб 18:51:53 #350 №1197582 
>>1194373 (OP)
Какая сейчас 14-30б моделька лучше всего умеет в русик? Алсо щупал Qwen3, кванты от unsloth через koboldcpp с пресетом ChatML и у меня даже с /think думалка не запускается, в чем может быть причина?
Аноним 10/05/25 Суб 19:08:27 #351 №1197614 
>>1197582
гемма
Аноним 10/05/25 Суб 19:13:46 #352 №1197621 
image.png
image.png
image.png
image.png
>what's up?
1. Цидонька-магнум
2. Немотрон 49б
3. Дроусноп
4. Гемма 27б аблитерейдет дпо
Свапнул пару раз и выбрал лучшее по моему мнению.
Кто подебил?
промпт один менялись только семплеры
Аноним 10/05/25 Суб 19:16:09 #353 №1197622 
Вступление кому интересно
It was an average morning at school, the sun shining through the windows and the clock ticking away as students poured into the rows of desk and seats adorning the classroom. Reika, her face still covered in cum from her most recent 'duty,' approached her classroom, pubic hair sticking out from her lips like a defiant statement. "Fuckin' bastards didn't even clean up their mess. Whatever, I ain't got time to dwell on that right now." There a test on the second period… If I don't ace this damn test, I’ll end up worse, like the gal shown off like a damn trophy on the fucking school lobby.

She swaggered into class, trying to act tough; but she can’t dispel stares and whispers about her appearance from her classmates. Shut the hell up, fuckers. I know what you're talking about, she thought as she plopped down into the seat next to her deskmate, Anon, giving them an apathetic once-over. "The hell you lookin’ at?" she said, flexing her fingers as she gripped a pencil, the remnants of her earlier 'session' still wet on her fingers. "Oh, my face. You know how it is. Don't worry 'bout me, just the usual." Dammit, screw everyone. Those asshole, my classmates, fuck them all. Why do they gotta approach me like this today of all days!? I can barely focus as it is!

Tsk, the hell is that face? I swear if they starts askin' questions about my "extra duties," I'll fuckin' explode. Reika shot them a defiant glare, wiping off the cum with the back of her hand. "What? If you anything to say, spill it, fuckface." she muttered between gritted teeth. Argh, fuck, I swore at them. That just came out naturally too! C'mon, don't take heart at it. At least do it after the test is over.
Аноним 10/05/25 Суб 19:19:29 #354 №1197624 
>>1197460
>>1197417
>>1197379
Спасибо.
Аноним 10/05/25 Суб 19:28:59 #355 №1197629 
>>1197621
> Кто подебил?
Ты подебил~. Тест непрезентативен: модели из разных весовых категорий, не тестируется понимание контекста на долгую, лупы, ум, разнообразие прозы и много что еще. Бессмыслица и попытка добавить масла в неутихающий два-три треда срач за модели.
Аноним 10/05/25 Суб 19:29:35 #356 №1197630 
>>1197629
>попытка добавить масла в неутихающий два-три треда срач за модели
То есть ты видишь победителя?
Аноним 10/05/25 Суб 19:31:09 #357 №1197632 
>>1197629
>два-три
десятка тредов
Аноним 10/05/25 Суб 19:46:10 #358 №1197645 
>>1197632
Собственно выход первой конкурирующей ллама модели пердопределило бесконечный срач.
Аноним 10/05/25 Суб 19:53:13 #359 №1197652 
>>1197550
>Чини детектор.
Если ты не заметил, я не указывал что это один подгоревший

>А мое реально говно для домашних систем, где как раз упор в объём памяти и тупые модели, и делать их ещё тупее с икспердами на 3B это маразм.
В твоих фантазиях разве что. Лучше бы ты молчал раз нихуя не знаешь
Аноним 10/05/25 Суб 19:53:39 #360 №1197653 
Из всех Qwen3-235B-A22B остановился в итоге на UD-Q2_K_XL. Удобно:
"override-tensor=blk\.(9[02468]|[1-8][02468]|[02468])\.ffn_down_exps\.=CPU" - каждый чётный тензор ffn_down_exps идёт в RAM, остальные плотненько сидят в мультиГПУ. 16к контекста в Q8_0, скорость генерации - от 10т/с и плавно снижается, но к 16к 5т/с ещё есть. Промпт процессинг - 70т/с, что терпимо, скажем так. Всё это на обычной Угабуге, в кавраковском форке может быть лучше, но влом пробовать. Мне пощупать хватило - модель хорошая, умная.
Аноним 10/05/25 Суб 19:55:40 #361 №1197655 
>>1197653
>в кавраковском форке может быть лучше
У него генерация быстрее на треть где то должна быть, промпт чтение точно быстрее минимум в 2 раза. Что критично для текста выше 2к контекста
Если нравится ждать долгой обработки тогда забей
Аноним 10/05/25 Суб 19:55:44 #362 №1197656 
>>1197653
Кстати параллельно пробовал Ллама-4-Скаут в 4KS - заметно хуже. Правда целиком влезает во ВРАМ, но даже так юзать не буду.
Аноним 10/05/25 Суб 19:55:45 #363 №1197657 
image.png
>>1197621
оправдания?
Аноним 10/05/25 Суб 20:01:29 #364 №1197663 
>>1197652
>В твоих фантазиях разве что.
Что в моих фантазиях? У тебя блядь избыток врама, но недостаток компьюта?
Аноним 10/05/25 Суб 20:04:33 #365 №1197666 
>>1197663
Так ей не нужен врам, ей хватает рам. С врам конечно быстрее но не критично, даже на cpu можно получить в начале генерации под 20 токенов в секунду, с падением до 10 где то на 4-6к контекста.
Для коротких по контексту сессий это имба.
Че тебе еще надо, собака?
Аноним 10/05/25 Суб 20:05:26 #366 №1197668 
>>1197657
Не рвись нищук с 8 врама.
Аноним 10/05/25 Суб 20:16:42 #367 №1197677 
>>1197621
Никто.

Я вчера пришел к удивительному умозаключению : я в душе не ебу, что лучше.
Где то недельку я гоняю Gemma27_Dpo и QWQ_snowdrop. Все исключительно на английском.
Я пробовал и кум и рп. Пробовал чатики.
Иииии - нихуя. Вот просто нихуя. It's all same shit
Сразу поясню, я крутил вертел семплеры как ебанутый, я менял промты как перчатки. Все для корректного опыта.
На некоторых карточках QwQ выдавал на 2-3 свайпе шизу, на некторых все было идеально. Иногда ризонинг великолепно подходил под контекст, иногда ризонинг лупил повествование.
гГде то гемма писала лучше, где то QwQ. Прям радуги от Геммы не заметил. В карточки с психопатичной принцессой, очень весело отпиливала руки, ноги ивырывала зубы, не стесняясь на смачные описания. Все по карточке персонажа, при этом в случае этой карточки что гемма, что QwQ одинаково шли по промту персонаа упиваясь болью {{char}}.
Единственное что я прямо ощутил, Гемма работает лучше при контексте 24к+. А QwQ все таки, выдает порой более разнообразные ситуации, но только с ризонингом. 9А это долго. И чем больше контекст, тем больше думает)

По самому тексту и построению, как бы странно не звучало, но гемма мне очень напомнила мистраль. Те-же обороты, такое же построение предложений. QwQ чуть свежее. Тут не качественная оценка самого текста, а именно разнообразие. Все эти шивер он май спайн гемма ебашит как не в себя. jawline, maybe just maybe, тряска бедрами. Ну мистраль же ёпта. Но это не плохо. Шивер действительно может быть он май спайн, когда персонаж собирается начать вырывать зубы. Но в отличии от {{char}} я бы еще и ссаться начал.

И к чему я это - вот за 2.5к сообщений суммарно на обоих моделях. На одних и тех же карточках, я не могу сказать что лучше, потому что они одинаково хуевы для всего. Но порой лучше в мелочах. А значит использовать нужно то что быстрее.
(Но справедливости ради, как же порой ризонинг в куме ебёт. Именно описание мыслей персонажа. Шишка встала, хвойный лес вырос)

Еще пробовал Star-Command_R но у меня с семейством command странная история. Я их просто не понимаю . Они вот просто есть. Не плохо и не отлично. Нормально. Своеобразно, суховато, но не глупые. Но блджад. Я просто не понимаю их, бывает такое, что не заходит - так и тут.
Аноним 10/05/25 Суб 20:19:24 #368 №1197680 
подскажите нейросеть чтобы хуй жопа пизда дрочить сосать
Аноним 10/05/25 Суб 20:20:57 #369 №1197682 
>>1197680
deepseek r1
Аноним 10/05/25 Суб 20:21:49 #370 №1197683 
>>1197680
https://huggingface.co/OddTheGreat/Apparatus_24B
Аноним 10/05/25 Суб 20:24:21 #371 №1197686 
>>1197677
Блджад. Я немного пьяненький, так что сорян за кривое написание текста со всеми этими проебами скобок и {{char}} вместо {{user}}.
Аноним 10/05/25 Суб 20:29:28 #372 №1197697 
>>1197666
>на 4-6к контекста
Как будто во времена пигмы вернулся. Когда все уже сидят на 16-32- и далее к контекстах, моебляди превозмогают на 4к. Победа, хули.
>Че тебе еще надо, собака?
Нужна новая мистраль ларж на 123B, умнее геммы, а что? Спасибо что спросил.
Аноним 10/05/25 Суб 20:30:49 #373 №1197702 
>>1197697
> моебляди
так это мистралеблядь, понял
Аноним 10/05/25 Суб 20:47:19 #374 №1197726 
>>1197702
Лол. Вот уж на что, а на мистральку пиздеть может только долбоёб. Эта трудяжка стала основой мира мелкомоделей. Если бы не мистраль, так бы и облизывали гемму без контекста, кривые тюны командра, да шизоквены.
Аноним 10/05/25 Суб 20:50:30 #375 №1197728 
>>1197726
Ты мистралеблядь не потому что используешь мистраль, а потому что выебываешься на других прикрываясь этим.
Сливаясь и обзывая другого навешивая на него ярлыки, будь готов к тому что к тебе будут относится так же, долбаёб.
Попизди мне тут, олламоед
Аноним 10/05/25 Суб 20:51:42 #376 №1197731 
>>1197697
>Как будто во времена пигмы вернулся. Когда все уже сидят на 16-32- и далее к контекстах, моебляди превозмогают на 4к.

На 4к превозмогают рамобляди и теслабляди. Потому что выше 4к там совершенно неюзабельной скорость становится. Тот самый мем про 1 токен в секунду.
Аноним 10/05/25 Суб 20:53:49 #377 №1197734 
Мда. .png
>>1197728
Скажи мне, выблядок, ты почему на сообщение без агрессии отвечаешь вот так ?
С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ? Или ты просто налетаешь на всех кто тебе отвечает ?
Аноним 10/05/25 Суб 20:55:15 #378 №1197737 
>>1197734
А нахуй ты в чужой спор влезаешь и потом скулишь?
Аноним 10/05/25 Суб 20:56:12 #379 №1197738 
>>1197726
Мистраль это кал. Максимально устаревшие модели, что угодно лучше него.
Аноним 10/05/25 Суб 20:58:33 #380 №1197741 
>>1197726
> на мистральку пиздеть может только долбоёб.
в то же время обсирает гемму, командера, квены.
так расскажи, что использовать, если кругом говно? только твои любимые мистральки? ты каждую другую базовую модель в пределах до 35б засрал
ответ - ллама 8б?
Аноним 10/05/25 Суб 21:03:39 #381 №1197742 
>>1197741
Вут ?
У тебя пальцы опережают мысли ? При чем тут гемма и квен ? Где ты в моем сообщении нашел это ?

>>1197737
А я и забыл, что тут у нас твой личный бложик.
Аноним 10/05/25 Суб 21:08:15 #382 №1197748 
>>1197742
> Где ты в моем сообщении нашел это ?
чел... у тебя твое же сообщение из контекста вышло?

> Если бы не мистраль, так бы и облизывали гемму без контекста
> кривые тюны командра
> шизоквены.

что нам использовать, если не гемму, командра да шизоквены?
трудяжку-мистраль только?
Аноним 10/05/25 Суб 21:08:35 #383 №1197749 
>>1197742
Вот и не скули, выблядок
Чувствуй себя как дома
>С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ?
Аноним 10/05/25 Суб 21:13:18 #384 №1197753 
>>1197748
>что нам использовать, если не гемму, командра да шизоквены?
трудяжку-мистраль только?
Ты неиронично использовал вторую гемму с её божественным контекстом в нуль целых хуй десятых, или восторгался первыми поломанными квантами ? Или первые версии комндра ?
>трудяжку-мистраль только?
Но её и использовали. Это была самая популярная нейронка. Еще раз прочти моё сообщение, если до тебя не доходит что я не о текщем времени говорю, а о прошлом.
Аноним 10/05/25 Суб 21:14:12 #385 №1197754 
>>1197749
Нихуя себе, говорящее говно.
Аноним 10/05/25 Суб 21:15:46 #386 №1197755 
>>1197753
https://youtu.be/QkOGzEZy0P8
Аноним 10/05/25 Суб 21:16:27 #387 №1197756 
>>1197753
>вторую гемму с её божественным контекстом

Контекст сломали только у третьей геммы, у второй было все в порядке. Когда она вышла - это была революция. В её классе на тот момент был только командир. Мистраль тогда был только немо 12В, он конкурентом гемме не был.
Аноним 10/05/25 Суб 21:18:32 #388 №1197757 
>>1197754
Давно ты заговорил?

>>1197748
А знаешь он действительно мистралееб, я угадал. Других сеток не признает
Аноним 10/05/25 Суб 21:20:20 #389 №1197759 
>>1197738
>Максимально устаревшие модели, что угодно лучше него.
>что угодно
Арэ ю шур эбаут ит ?

>>1197756
>Контекст сломали только у третьей геммы,
Я про размер контекста. И к тому её первые кванты еще теми поломанными кусками говна были. Я помню, я знатно горел, с того что у гуглоподелия контекста хватало на 25 сообщений. Лол и она шизила рандомными символами.
Или пердолинг с шифтингом и постоянным суммарайзом мы просто вычеркнули из реальности ?
Аноним 10/05/25 Суб 21:24:19 #390 №1197760 
>>1197759
>Я про размер контекста.

Размер контекста для вменяемых локалководов не является проблемой наверное с середины 2023 года, когда открыли rope scaling и автор кобольда добавил автоматический расчет нужных коэфициентов для любого нужного тебе контекста. Так что пока ты там ебался с суммарайзом я до 64к контекст разгонял и чатился в свое удовольствие.
Аноним 10/05/25 Суб 21:25:13 #391 №1197762 
>>1197757
>Давно ты заговорил?
>нет ты дурак
Впрочем от того кто читает сообщения жопой и переходит на визг, я ничего другого не ожидал.

>Других сеток не признает
Литералли писал выше что гемма и QwQ хороши, но долбоёбу главное до кого нибудь доебаться.
Аноним 10/05/25 Суб 21:27:42 #392 №1197764 
>>1197702
Я на гемме сейчас, а до этого на ларже сидел.
>>1197731
Ну а я про что? А на враме мое гонять нет смысла. Итого в мое нет смысла, так как на 1 токене жизни нет.
>>1197737
>чужой спор
Это АИБ, детка.
>>1197753
>первые версии комндра
Вполне себе норм были для своего времени.
Аноним 10/05/25 Суб 21:27:47 #393 №1197765 
>>1197762
> Литералли писал выше что гемма и QwQ хороши
А я и забыл, что тут у нас твой личный бложик.
Аноним 10/05/25 Суб 21:31:04 #394 №1197768 
>>1197760
>rope scaling
Ооокей. Давай на этом остановимся. Потому что уже тысячу раз проходили. Мы определенно перейдем к тому что я буду писать, что при растягивании ануса, модель пишет как лоботомит, а ты будешь удтверждать что всё это не правда и сам Достоевский спустился в твою врам.

>>1197765
Вот и не скули, выблядок
Чувствуй себя как дома
>С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ?
Аноним 10/05/25 Суб 21:35:13 #395 №1197772 
>>1197765
>>1197768
Тред залупился. Меняйте модель.
Аноним 10/05/25 Суб 21:36:07 #396 №1197773 
>>1197772
Семплеры же. Врубаем DRY!
Аноним 10/05/25 Суб 21:36:45 #397 №1197774 
>>1197768
>Достоевский спустился в твою врам
Прочитал как "Достоевский спустил в твою врам", долго думал.
Аноним 10/05/25 Суб 21:38:04 #398 №1197775 
>>1197774
Прописываю вам троганье травы 2 раза в день. Прогулки и минимизацию общения с ЛЛМ.
Аноним 10/05/25 Суб 21:40:46 #399 №1197777 
image.png
А немотрон даже что-то может на хорни карточке
Аноним 10/05/25 Суб 21:50:03 #400 №1197779 
Весь тред засрали вечным срачем, чей фломастер лучше входит в жопу.

Накидайте каких нибудь интересных миксов. Может что то свежее от девида, или что нибудь драммер выкатил, а может од. Ну короче, не будьте жадинами.


>>1197777
Ничего с собой не могу поделать, но крякаю каждый раз когда вижу. немотрон ... Как какой-то автобот, лол.
Аноним 10/05/25 Суб 21:57:03 #401 №1197785 
>>1197773
Ну раздевайся, буду крутить твои семплеры, хуле.
Аноним 10/05/25 Суб 22:02:29 #402 №1197788 
>>1197762
А нахуя ради тебя напрягаться?

>>1197779
Ну вот тебе новость, недавно опять гемму починили и были перезаливы. Если пользуешься то перекачай проверь
Аноним 10/05/25 Суб 22:16:01 #403 №1197802 
Некотрончик подхватывает каждую письлюку из промпта и карточки и предельно дотошно описывает окружение если надо
После геммы он вообще кажется безсоевым, на приставания больше не срет внутренним диалогом "какая противная хуемразь", некотрончику будто вообще похуй что происходит, он просто исполняет как просят.
Даже кум чуть лучше гемы, но не аблитерации
Аноним 10/05/25 Суб 22:20:36 #404 №1197808 
>>1197802
>Некотрончик подхватывает каждую письлюку из промпта и карточки и предельно дотошно описывает окружение если надо
Неплох был бы Магнум на его основе.
Аноним 10/05/25 Суб 22:29:03 #405 №1197815 
>>1197788
>Ну вот тебе новость, недавно опять гемму починили и были перезаливы. Если пользуешься то перекачай проверь

А что именно починили?
Аноним 10/05/25 Суб 22:31:25 #406 №1197818 
>>1197802
Тебе нормально гемму и немотрон сравнивать ?
Они же в одинаковых весовых категориях, ага.
Предлагаю в следующий раз сравнивать с немо. Ну а хуле и там и там есть немо.
Аноним 10/05/25 Суб 22:35:21 #407 №1197823 
>>1197818
Какая разница у меня всё на 24гб врам умещается?
Аноним 10/05/25 Суб 22:40:39 #408 №1197827 
>>1197823
70b в 24гб ? Ты с 3к контекста запускаешь ?
Аноним 10/05/25 Суб 22:40:50 #409 №1197828 
>>1197823

Как ты немотрон в 24 гб уместил? В 2 битах?
Аноним 10/05/25 Суб 22:47:43 #410 №1197838 
>>1197827
>>1197828
Я про 49, новый. 3q_m c q4 кешем либо 3q_s без квантования кеша
Можете и дальше коупить что это лоботомит от 70б ламмы, он лучше геммы и лучшее что вообще есть на одной 3090 не для кума
Аноним 10/05/25 Суб 22:49:39 #411 №1197841 
>>1197838
>Можете и дальше коупить что это лоботомит от 70б ламмы,
Чё блять, я вообще в первый раз о нем слышу. Поэтому и спрашиваю.

>он лучше геммы и лучшее что вообще есть на одной 3090
Что нравится, то и используй лол. Вообще насрать, те кому нравится шемма на ней сидят, кто то дрочит квены, кто то звездный командир, кто то лягушкоед - и все счастливы.
Аноним 10/05/25 Суб 22:50:06 #412 №1197842 
>>1197838
Дурачок на Руди, это ты?
Немотрон - урезанная Ллама, которую ты урезаешь дальше, катая на втором бите. Используй что душе угодно, но не надо этого лоботомита рекламировать. Здесь люди не только безмозглым кумом увлекаются.
Аноним 10/05/25 Суб 22:53:25 #413 №1197847 
>>1197842
Вот и первый гейткипер порвался.
Не слушайте этого гандона он хочет чтобы все сидели на мистралях и не рыпались
Аноним 10/05/25 Суб 22:55:13 #414 №1197849 
>>1197847
Руди, второй бит... Второй...
Аноним 10/05/25 Суб 22:56:03 #415 №1197850 
>>1197838

Выложи свои настройки, попробую. По тестам немотрон и правда в топах.
Аноним 10/05/25 Суб 22:57:05 #416 №1197851 
>>1197850
Квен 3 тоже топ, на 10 процентов уступает дипсику. Может его лучше?
Аноним 10/05/25 Суб 22:57:26 #417 №1197852 
>>1197847
>чтобы все сидели на мистралях
Сижу на 123b мистрали, на что посоветуешь перейти ?
Я серьезно. Раз уж тут в треде в се пишут, что мистраль говно.
Какие есть варианты. Я неиронично буду пробовать.
Аноним 10/05/25 Суб 22:59:19 #418 №1197855 
>>1197852
Если потянешь пробуй Qwen3-235B-A22B, больше крупных сеток не выходило.
Ну ладно вроде командер был еще, но чет я на его счет в сомнениях
Аноним 10/05/25 Суб 22:59:46 #419 №1197858 
>>1197852
Гемма 3 27В, лол. Я вот даунгрейднулся. Но мне ещё мешает лишь 2 3090, мне на 123В уже слегка за гранью.
Аноним 10/05/25 Суб 23:00:56 #420 №1197861 
>>1197849
Да не рвись ты, хуйлуша.
3м квант 49б модели - катастрофа, лоботомит.
4м квант 22-35б - омномном, выше уж копиум, прироста нет
Аноним 10/05/25 Суб 23:03:37 #421 №1197870 
>>1197861
Да, это буквально доказано. Модель очень тупеет ниже 4 бит. Разница между 4 и 8 бит не такая, как между 3 и 4. У тебя два бита в голове, Руди~
Аноним 10/05/25 Суб 23:06:27 #422 №1197877 
>>1197870
> Разница между 4 и 8 бит не такая, как между 3 и 4.
Ну ты это, не перегибай. Тут скорее
>Разница между 4 и 6 бит не такая, как между 3 и 4.
Аноним 10/05/25 Суб 23:08:38 #423 №1197880 
>>1197855
Мммм... 4 квант больше 70гб, пойду зашью себе жопу заранее, а то порвется.

Спасибо, я слишком нищую для таких весов.
Аноним 10/05/25 Суб 23:09:36 #424 №1197883 
>>1197880
А то мистраль меньше, ога.
Аноним 10/05/25 Суб 23:10:06 #425 №1197884 
>>1197880
Выше речь о сравнивании квантов одной модели, если выбора нету то конечно 3 квант большой модели лучше чем 6-8 меньшей
Аноним 10/05/25 Суб 23:13:29 #426 №1197890 
>>1197880
Да и кстати, там можно большую часть на процессоре оставить. Сколько впихнешь в врам с тем и запускаешь. Можно изъебнуться и увеличить скорость в двое используя перераспределение слоев и запуск на форке llama.cpp специально оптимизированного для мое сеток.
Короче с таким размером скорости будут не такими убогими как на плотной модели в 70 гб
Аноним 10/05/25 Суб 23:16:19 #427 №1197896 
image.png
>>1197852
Аноним 10/05/25 Суб 23:17:25 #428 №1197900 
image.png
>>1197850
С промптом ещё не решил как и с семплерами но оно хотя бы работает в отличии от квена3
Темплейты лама 3 намес
Ставишь в промпт
Writing style:
Don't use lists and out-of-character narration.
{char} MUST use narrative format.
Detailed thinking off.
Аноним 10/05/25 Суб 23:17:27 #429 №1197901 
Qwen-235b-HuggingChat.png
Qwen-235B-HuggingChat-result.png
Qwen30B-Local-iq1m.png
Qwen30B-Local-iq1m-result.png
MoE qwen3-235b на сайте huggingchat vs MoE qwen3-30b iq1_m локально на LM studio. походу iq1_m квант всё же имеет право на жизнь.
Аноним 10/05/25 Суб 23:17:44 #430 №1197902 
>>1197896
чел, вроде уже выяснили, что жизнь начинается с 235б... --> >>1197657
Аноним 10/05/25 Суб 23:19:16 #431 №1197905 
>>1197901
>qwen3-30b iq1_m
Ты там совсем ебанулся, да? Уважение
Аноним 10/05/25 Суб 23:20:02 #432 №1197907 
>>1197896
>пик
Я где то написал что жизни нет или другие модели говно ?
Или тебя триггерит что кто то пользуется большими моделями ?
Ну вы же тут на говно исходите что мистраль говно, и только один анон посоветовал какую то замену.
Вас хуй поймешь.
Ну критикуете - предлагайте тогда замену.

>>1197890
Да в принципе, спасибо. Неиронично, я думал там будут 90-100гб кванты. Но нет, они схожи с мистралевскими. Уже кочаю.
Аноним 10/05/25 Суб 23:23:12 #433 №1197913 
>>1197902

Конкретно этот мистралешиз на нескольких теслах уже который месяц хуесосит все модели вокруг чтобы когда его спросили - "а что собственно использовать?" - с гордым видом обьявить что он сидит на 123В.
Аноним 10/05/25 Суб 23:23:19 #434 №1197914 
>>1197852
удвою Qwen3-235B-A22B
это единственная сетка, которая смогла корректно ответить на вопрос про баттлнек ддр3 и 25 гигабит/с сетевого адаптера.
Я брал 4 XS квант.

Гемма само собой брала залупу за обе щёки, когда я пытался из неё правильный ответ выбить. Но нет, она тупая пиздец - видит "ddr3" и даже не думая сразу говорит что баттлней в ней.
Тупое говно блять. Ну а чего еще ждать от 27б, с другой стороны. Любители слопа в треде жрут вон и нахваливают.
Аноним 10/05/25 Суб 23:25:00 #435 №1197919 
>>1197907
Хуй поймешь, ты троллишь или серьезно.

Критикуют лоли мистрали, шизы с треда (за редким исключением гигашизов) не имеют железа чтобы запускать милфочку. Поэтому говоря о мистрали - говорят о лольках.

Ну и завидуем, хуле врать то. Я со своими 16 - завидую.
Аноним 10/05/25 Суб 23:25:12 #436 №1197921 
>>1197913
о, мой поклонник, и ты тут? Дежуришь, ждешь меня чтоли?
Хороший пёсик.
Только ты перепутал, он - не я.
Опять ищещь меня в анонах?

Я ищу в толпе глаза её жадно
То ли девочки а то ли виденья...


Теперь любой кто тебе скажет что-то плохое детектится как я, да?
Аноним 10/05/25 Суб 23:25:47 #437 №1197923 
>>1197907
>Ну критикуете - предлагайте тогда замену.

Если ты серьезно и не тралишь, то новый командир 111В.
https://huggingface.co/CohereLabs/c4ai-command-a-03-2025
Аноним 10/05/25 Суб 23:27:15 #438 №1197929 
>>1197921

Вспомнишь говно - а вот и оно, как говорится.
Аноним 10/05/25 Суб 23:28:25 #439 №1197931 
>>1197929
Ну так ты меня сам призываешь в тред своими фолс-детектами.
Или детектор настрой или уже перестань на меня обижаться непонятно за что.
А то на обиженных сам знаешь - воду возят и в жопу ебут.
Аноним 10/05/25 Суб 23:33:25 #440 №1197941 
>>1197923
Оппа, а тестики то не плохие. Экий я простофиля. Спасибо.
Буду тыкать и пробовать.
Аноним 10/05/25 Суб 23:33:40 #441 №1197942 
>>1197913
мистралешиз
сноудропшиз
теслашиз
опенротершиз
дипсикшиз
я никого не забыл, анон? или ты еще кого-нибудь изобрести успел?
Аноним 10/05/25 Суб 23:36:37 #442 №1197950 
>>1197914
>удвою Qwen3-235B-A22B
это единственная сетка, которая смогла корректно ответить на вопрос про баттлнек ддр3 и 25 гигабит/с сетевого адаптера. Я брал 4 XS квант.

Буду и квенку и команд-а пробовать. Посмотрю что лучше подойдет. Вроде в квене таки параметров побольше, но команд должен быть побыстрее.

>Гемма само собой брала залупу за обе щёки, когда я пытался из неё правильный ответ выбить.

Эмм... А вот этот пассаж я не понял. Нахуя сравнивать 27b и 235и модели... Это же - тупо.
Аноним 10/05/25 Суб 23:39:59 #443 №1197955 
>>1197950
> Вроде в квене таки параметров побольше, но команд должен быть побыстрее.
Неа, быстрее будет квен раз в 5 где то.
Мое сетки все быстрые, там активных параметров 22b.
Это значит что каждый токен дергаются разные эксперты общей суммой в 22b. А в 4 кванте это 11гб. Там конечно еще всякие издержки, ну считай что скорости все равно будут больше чем у плотной модели того же размера раз в 5.
Аноним 10/05/25 Суб 23:40:01 #444 №1197956 
>советы Qwen3-235B-A22B
Это троллинг такой? Все треды были забиты презрением к мое, и даже какой-то анон писал, что, мол, поюзай дипсик в тексткомплишене, будет экспириенс 30б модели. А сейчас уже внезапно 235б мое стали советовать как замену ларджу, охуеть
Аноним 10/05/25 Суб 23:40:07 #445 №1197957 
>>1197942
То чувство когда тебя называли минимум 3мя из списка.
Аноним 10/05/25 Суб 23:40:56 #446 №1197959 
>>1197956
> Все треды были забиты презрением к мое
То что периодически какие то додики срали этим не значит что это общее мнение всего треда
Аноним 10/05/25 Суб 23:41:42 #447 №1197961 
>>1197950
>Эмм... А вот этот пассаж я не понял. Нахуя сравнивать 27b и 235и модели... Это же - тупо.

Потому что он шизло >>1197913
Видимо с 123В он перелез на 235В, но повадки остались неизменными.
Аноним 10/05/25 Суб 23:42:08 #448 №1197963 
>>1197950
>но команд должен быть побыстрее
он мое или нет? Если не мое - то он будет медленнее 100%.
Потому что квен 235б а22б - мое.
>Нахуя сравнивать 27b и 235и модели
да не сравнивал я... Я просто пошел от мелкой модели к более крупным.
гемма2 27б, гемма3 27б, магнум 123б 4Q, магнум 123б 6Q.
Думал что за хуйня - то ли лыжи не едут, то ли я ебанутый.
и потом я случайно в треде увидел, что анон писал про квен. Попробовал его - и оказалось что он имеет мозги лучше, чем все сетки, которые я пробовал.
Оказалось, что лыжи виноваты.
А потом у меня сгорела видеокарта, а за ней и мой пердак и эксперименты с квеном прекратились потому что модель 117 гб размером, а с одной вышедшей из строя картой я уже не могу её запустить.
Аноним 10/05/25 Суб 23:44:51 #449 №1197968 
image.png
Снимок экрана 2025-05-10 231646.png
image.png
image.png
в целом qwen30b-a3 в iq1_m кванте иногда опечатывается и не совсем хорошо следует промпту, но с нормальной скоростью похеру - ткнуть носом в ошибку и перепишет со свистом. рисовалку он написал в режиме /no_think, если использовать /think, то точнее следует промпту (результат на последнем скрине). но один хер надо по ходу действия указывать на его фейлы.
Аноним 10/05/25 Суб 23:48:45 #450 №1197976 
>>1197968
Сравни тогда с 1 квантом квен3 32b что ли, гулять так гулять
Аноним 10/05/25 Суб 23:50:03 #451 №1197982 
ладно это пиздец
прелюдии и ТЕНШОН у немотрончика превосходит вообще всё что я пробовал, главное выбрать развратную карточку и надавать ей по сиськам
Аноним 10/05/25 Суб 23:50:04 #452 №1197983 
>>1197963
>магнум 123б 4Q, магнум 123б 6Q.
Кстати, поробуй бегемота от драммера. Я с него шишку сточил в своё время. Есоли будут нужны семплеры, то маякни.
Магнум какой то ебанутый, он или посреди генерации ломался к хуям начиная дергать рандомные токены или пишет как цидония. И тут упрек не к цидонии, но если берешь жирную модель хочешь увидеть отличия от экипажа гоблинов в третьем пазике.
Или вот это (Да, я фанбой драммера)
https://huggingface.co/mradermacher/Fallen-Command-A-111B-v1.1-GGUF
Увидев что я проебал коман-а, я проебал и это. Так что своего ИМХО не смогу сказать, буду только пробовать.
Аноним 10/05/25 Суб 23:50:19 #453 №1197984 
>>1197956

Ну смотри.
Условная мое 30В загружает видеопамять на 30В - выдаст мозги и знания всего на 14В и скорость как 3В. В то время как плотная модель 30В выдаст мозги, знания и скорость на честные 30В за тот же расход врам.
Аноним 10/05/25 Суб 23:52:49 #454 №1197987 
>>1197984
>выдаст мозги и знания всего на 14В
Ты прав, но там чуть больше, где то на 16-18b если бы такая была. Как по мозгам.
По знаниям там на ровне с 32b думаю, просто она их хуже использует. Потому что у нее слоев едва больше чем у 14b.
Аноним 10/05/25 Суб 23:54:30 #455 №1197989 
Драммер...Говорите
Гемофаги и гемотофаги, смотрите что тут у меня

https://huggingface.co/TheDrummer/Fallen-Gemma3-27B-v1

Pshhh. pshhh кумляндия, запрашиваю личный опыт. Повторяю запрашиваю личный опыт. Кто пробовал ?
Аноним 10/05/25 Суб 23:55:21 #456 №1197991 
>>1197989
гема вперде
Аноним 10/05/25 Суб 23:56:33 #457 №1197993 
>>1197991
Не нравится, не ешь. А я буду жрать всё до чего дотянусь.
Аноним 11/05/25 Вск 00:00:18 #458 №1197998 
>>1197989
Почему то все из геммы пытаются сделать "ДАРК КОМПЛИНТЛИ АНЗЕРЗОРЕД ФАЛЕН ТОР ТЕМНЫЙ ИНТЕРНЕТ АМОРАЛ ДАРКВЕБ БЛЯЯТЬ" версию и все равно получается соевое говно
Аноним 11/05/25 Вск 00:03:28 #459 №1198001 
>>1197998
Вот кстати. Есть у меня карточка где персонаж вроде любит игрока, но у неё специфичные методы. И я вчера сидел и такой : блять, гемма, кровожадная ты пизда, хватит следовать так промту остановись, серьезно.
А во ответ : принесите пилу для костей, я хочу изменить рост своей любви.
Беру свои слова назад начет соевой геммы. DPO дала мне просраться.
Аноним 11/05/25 Вск 00:09:09 #460 №1198012 
>>1197998
>Почему то все из геммы пытаются сделать "ДАРК КОМПЛИНТЛИ АНЗЕРЗОРЕД ФАЛЕН ТОР ТЕМНЫЙ ИНТЕРНЕТ АМОРАЛ ДАРКВЕБ БЛЯЯТЬ"

Это драммер, главного поставщик темных школоивельных шизомиксов, он любую модель пытается сделать таковой. Кроме квена, почему-то он не любит китайцев.
Алсо, гемма просто дегенеративно-радостно соевая, это реально просится поправить.
Аноним 11/05/25 Вск 00:10:46 #461 №1198014 
>>1198012
>он любую модель пытается сделать таковой.
Ну цидонька получилась хорошей же, ну.
Аноним 11/05/25 Вск 00:12:49 #462 №1198019 
>>1197983
>Кстати, поробуй бегемота от драммера.
Спасибо, буду иметь в виду.
Я правда сейчас слегка остыл к локальному куму, мне больше напарник по работе нужен.
Вспоминаю как возвращался к гемме и там ехал смиркс через щивер он май спайн - аж воротит с этой хуйни. Но если захочу нейрокум - попробую обязательно.
Аноним 11/05/25 Вск 00:14:23 #463 №1198021 
как вы смогли выйти из комнаты имея хотя бы 16гб врам?
Аноним 11/05/25 Вск 00:16:02 #464 №1198024 
>>1198021

Я бы и не выходил, если бы не экономическое принуждение к труду, как говорил Маркс.
Аноним 11/05/25 Вск 00:18:12 #465 №1198026 
>>1197621
Разные ответы. Можно погрузиться в спгс или отметить определенные проблемы/особенности каждой модели, но здесь еще многое зависит от промта, карточки и предпочтений юзера.
>>1197653
> Промпт процессинг - 70т/с, что терпимо
Жесть
>>1197657
Ерунда вялая, слишком мало активных параметров. Только как "убийца дипсик дома" для ачивки.
>>1197726
> основой мира любителей мелкомодельного слопа
Починил. Но в целом мистраль-ии как компанию можно похвалить, релизят уже молодцы. Вот бы новый мистральлардж.
Аноним 11/05/25 Вск 00:21:31 #466 №1198028 
>>1198021
>выйти из комнаты
зачем? Я удаленщик наносек например.
Выйти на улицу - значит выйти к пидорахам. Не особо люблю такое конечно, но мусор сам себя не вынесет.
Да и новую квартиру отделывать надо, тут тоже никак удаленно работу не прокнотролируешь и материалы не выберешь.
Вот и все поводы выходить.
>>1198026
>Ерунда вялая
я абсолютно не согласен.
Я своими глазами видел хороший последовательный ход мыслей и отсутствие избыточности тьекста там, где это не нужно. Я очень заинтересован дальше поковырять квен3.
И да, я уверен, что те кто хейтят квен просто используют мелкие модели, а не 235б а22б - самую большую.
Я так и не успел узнать, умеет ли она писать стихи на русском. Именно на этой просьбе у меня сгорела карта.
Аноним 11/05/25 Вск 00:25:09 #467 №1198030 
>>1197653
>Промпт процессинг - 70т/с

Да ты знатный любитель потерпеть, я смотрю...
Аноним 11/05/25 Вск 00:30:36 #468 №1198032 
image.png
>>1197976
скорость в 2 раза ниже, нужного результата очень сложно добиться, потрахался с различными настройками и забил. это я еще q2 квант скачал. хз почему так выходит что moe в низком кванте обставляет dense 32b
Аноним 11/05/25 Вск 00:32:57 #469 №1198033 
>>1198032
любопытно
Аноним 11/05/25 Вск 00:34:57 #470 №1198034 
image.png
Ого, что-то я совсем пропустил появление exl3 квантов и того как мощно они ебут Жору в хвост и гриву, выдавая 3 бит модели с качеством жориных 4 бит.
Да походу реально можно немотрон в нормальном качестве на 24 гб врам использовать.
Аноним 11/05/25 Вск 00:35:19 #471 №1198035 
>>1198032
Какой ваш вердикт, доктор : низкий квант будет жить ? Или легче пристрелить ?
Аноним 11/05/25 Вск 00:35:27 #472 №1198036 
Мне делать видео "вы не поняли немотрон" или что?
Я тут радугой кончаю, кум оказался охуенным, ты не скипаешь 70% слопа а реально читаешь это всё
Аноним 11/05/25 Вск 00:36:34 #473 №1198037 
>>1198035
Тут надо бегать и кричать
ОНО ЖИВОЕ
Это сраный 1 квант, я хз как он его додумался вобще скачать
Аноним 11/05/25 Вск 00:41:11 #474 №1198039 
>>1198036
Я опишу что будет :
>ряяяя только 16 гб (это буду йа)
>Сейчас скачаю, потом : ряяя у меня не работает. Говно. Слоп

Вывод : посиди с ней недельку и когда первый восторг пройдет, ты сможешь написать взвешенное мнение без фанбойства.
Аноним 11/05/25 Вск 00:42:46 #475 №1198041 
image.png
image.png
Пиздец, как же же это дерьмо ебет. Почему я только сейчас про это узнал.
Аноним 11/05/25 Вск 00:44:16 #476 №1198044 
>>1197956
> поюзай дипсик в тексткомплишене, будет экспириенс 30б модели
Ну не совсем 30б, где-то лучше, где-то чуть хуже, но он не выделяется каким-то особым вниманием к деталям, инициативностью, красочным описанием и т.д., чего ожидаешь. Чсх, зирошотом часто работает даже лучше чем с ризонингом, там он проделывает огромный (и местами даже неплохой) анализ, повторяет все инструкции, что-то продумывает, читаешь и думаешь какая умная модель. А потом выдает унылый и банальный ответ если не уровня пигмы, то мелких мистралей, полностью позабыв все раскопанное.
Для него норм всякие сценарии с вводом новых нпсей, накидывание дополнительных инструкций типа старых модулей что были популярны раньше с корпами, там кажется что все это не усложняет работу а наоборот улучшает результат. Но стоит какой-то заморочный/душный рп с разговорами, мотивами, развитием и т.п. - не вытягивает. Персонажи - болванки без глубины, которые выдают тривиальные ответы и фиксируются на чем-то одном. И еще размер чрезмерно большой для такого перфоманса.
> 235б мое стали советовать как замену ларджу
Это же вброс, вообще не близко, ограниченное количество голов не позволит.
>>1197963
> и оказалось что он имеет мозги лучше, чем все сетки, которые я пробовал
Бедолага накрутил промты, семплинг и не мог сформулировать вопрос, когда ему нормальная сетка не могла выдать дефолт, что может ванильный мелкий мистраль. А к большим квеном внезапно удачно рандом лег, вот он и уверовал.
Синдром утенка из палаты мер и весов, в добавление к неспособности анализировать свой опыт и делать трезвую оценку.
>>1198028
> видел хороший последовательный ход мыслей и отсутствие избыточности тьекста там, где это не нужно
Никто не мешает ей иногда перформить хорошо, но стабильно ебать и быть на уровне больших плотных моделей - без шансов. Ну и учитывая от кого эти заявления - впечатления нужно делать на 10.
Аноним 11/05/25 Вск 00:46:42 #477 №1198046 
>>1198041
Жопой ебет?
Аноним 11/05/25 Вск 00:47:48 #478 №1198047 
кстати немотрончик то есть в exl3 авось это уже близко к 4 кванту
Аноним 11/05/25 Вск 00:48:55 #479 №1198048 
>>1198046

Поясни свой вскукарек.
Аноним 11/05/25 Вск 00:50:51 #480 №1198049 
>>1198048
Я петушок. "Вопросы?"
Аноним 11/05/25 Вск 00:51:11 #481 №1198050 
>>1198034
>>1198041
Остуди траханье. То что этот хуй принес циферки, пока мало что значит. Нужно больше тестов, причем всего, не только perplexity. Пусть эта хуйня из беты выйдет, потом можно о ней рассуждать. Но да, выглядит многообещающе
Аноним 11/05/25 Вск 00:51:45 #482 №1198051 
>>1198047

Именно у немотрона 3.0bpw по качеству как IQ4-XS. >>1198034
Аноним 11/05/25 Вск 00:52:48 #483 №1198053 
45501692db6567b19042.webm
>>1198044
>Бедолага накрутил промты, семплинг и не мог сформулировать вопрос
>Ну и учитывая от кого эти заявления - впечатления нужно делать на 10.
ты, шизло блять, опять на связь выходишь?
Ты понимаешь, что проблема была в том, что все модели ассоциировали ддр3 с устаревшей технологией и поэтому сразу судили что в ней будет баттлнек?
Я роллил ответы квена - он анализировал всё правильно несколько раз подряд.
Аноним 11/05/25 Вск 00:55:35 #484 №1198056 
>>1198050
>То что этот хуй принес циферки, пока мало что значит.

Так он не только циферки, он и модели принес. Прям сейчас качаю немотрона 49В 3.0bpw, буду сравнивать с IQ3-XSS того же размера.
Аноним 11/05/25 Вск 00:57:51 #485 №1198058 
>>1198053
Шизик смеет кого-то оскорблять, вот умора. Скоро и другие карты отрыгнуть если продолжишь в том же духе.
Аноним 11/05/25 Вск 00:59:39 #486 №1198059 
image.png
image.png
image.png
>>1198035
ну этот поциент точно может жить: https://huggingface.co/unsloth/Qwen3-30B-A3B-GGUF/blob/main/Qwen3-30B-A3B-UD-IQ1_M.gguf

задачу поиска лиц по папкам с фотографиями и последующей сортировки их по похожести тоже решает. узнал много нового про onnxruntime-gpu и insightface. интересно как себя поведёт 235B модель. к сожалению она у меня не влезет даже в q1 кванте. тут я вижу есть аноны с железом покруче, попробуйте. PS приложил настройки LM studio для 30b
Аноним 11/05/25 Вск 00:59:54 #487 №1198060 
>>1198058
>Скоро и другие карты отрыгнуть
я имею зп больше 400к/мес, а то что карта отъебнула - вероятностное событие случающееся с теми, у кого этих карт много.
Завидуй молча.
Аноним 11/05/25 Вск 01:00:08 #488 №1198061 
>>1197968
Я конечно первый квант не тестил, но на третьем кванте эта хуйня довольно тупая. Сосет у 14b на более высоком кванте, не говоря о том, что по всей видимости 14b~30b и тут просто выбор скорость или память
>moe в низком кванте обставляет dense
По идее должно быть наоборот. МоЕ больше должно хуеть от квантования
Аноним 11/05/25 Вск 01:01:15 #489 №1198063 
>>1197942
3090-шизы же.
>>1197968
>a3 в iq1_m
Пиздос.
Аноним 11/05/25 Вск 01:02:16 #490 №1198064 
>>1198060
>я имею зп больше 400к/мес
А хули не купил ни одной А100 хотя бы?
Аноним 11/05/25 Вск 01:02:25 #491 №1198065 
>>1198059
>задачу поиска лиц по папкам с фотографиями и последующей сортировки их по похожести тоже решает

А как реализовать подобное? Это в лм студио есть такая функция?
Аноним 11/05/25 Вск 01:03:56 #492 №1198067 
>>1198064
копить на квартиру побольше или собственный дом - более приоритетно.
Хотя конечно с текущей инфляцией.... может и неплохая идея переводить фантики в натуральный продукт в виде топовых карт.
Надо будет об этом подумать....
Аноним 11/05/25 Вск 01:08:21 #493 №1198068 
>>1198060
Чел, по твоей речи, чсв, общению и прочему очевидно, что умом ты не блещешь.
> 400к/мес
> наносек
>>1198067
> квартиру побольше или собственный дом
> 400к/мес
Всхрюкнул, решил насмешить один из самых успешных тредов на всей борде.
Аноним 11/05/25 Вск 01:11:05 #494 №1198071 
>>1198068
>>1198067
Так, вы оба - Идите спать. Ваш срач уже опизденел, остыньте, горячие нейронные парни.
вы оба самые успешные, самые лучшие и бла бла бла.
А если не прикратите, я скастую тёмную магию и призову асигодетей.
Аноним 11/05/25 Вск 01:11:08 #495 №1198072 
>>1198068
>решил насмешить один из самых успешных тредов на всей борде.
хм, не буду отрицать, что тут ты прав.
Но держу пари, что шизло которое тут усирается "у тебя семплинг хуемплинг, промт и шаблоны" - нищее чмо которое только гемму запустить и может.
Аноним 11/05/25 Вск 01:12:44 #496 №1198074 
>>1197942
>мистралешиз
Это если что полтреда, если не больше. Спасибо тюнам и тому что 22/24 единственные нормально влезают в 16гб, а также немотрону 12б с русскими тюнами, работающим вообще на любой хуйне
>опенротершиз
>дипсикшиз
Это один и тот же человек. Как минимум раз в неделю приходит рекламировать свое говно
>теслашиз
Еще и его брат драмошиз. Набрали дешманского говна с помойки и запускают большие модели на 0.9 т/c
>я никого не забыл, анон?
Ну как минимум еще есть геммашизы, которые оправдывают эту соевую хуйню при любом раскладе
Аноним 11/05/25 Вск 01:13:50 #497 №1198075 
>>1198074
нужен алтугезер ящитаю...
Аноним 11/05/25 Вск 01:14:00 #498 №1198076 
>>1198071
> А если не прикратите, я скастую тёмную магию и призову асигодетей.
Ну не, смотивируй как-нибудь. Скинь карточку милую - интересную, или что-нибудь еще.
>>1198072
Проебы столь очевидны что тебе пишет много людей, выходит что мантра про "это все один шиз" хорошо дополняет твой образ.
Аноним 11/05/25 Вск 01:16:35 #499 №1198079 
image.png
image.png
Запустил 3.5 квант с 20к контекста
итс со факинг овер
я больше никогда не выйду из дома
Аноним 11/05/25 Вск 01:16:47 #500 №1198080 
>>1198065
>Это в лм студио есть такая функция?
нет, я попросил qwen написать скрипт на питоне. запускается из командной строки и натравливает gpu на папки с фотками. пока всё ещё сыро, надо будет допилить логику чтобы лучше лица сортировало и gui добавить.

>>1198061
>Я конечно первый квант не тестил, но на третьем кванте эта хуйня довольно тупая.
попробуй модель по ссылке https://huggingface.co/unsloth/Qwen3-30B-A3B-GGUF/blob/main/Qwen3-30B-A3B-UD-IQ1_M.gguf и настройки отсюда >>1198059
Аноним 11/05/25 Вск 01:18:07 #501 №1198081 
>>1198076
>это все один шиз
это и есть геммашиз, единый во многих лицах - очевидно же.
Почему-то чел, советовавший мне бегемота на промты и семплинг не гнал. Этого так же не делал и анон с дипсиком.
Аноним 11/05/25 Вск 01:19:42 #502 №1198083 
>>1198076
>Скинь карточку милую - интересную, или что-нибудь еще.
Вот тебе милая webm из первой серии SukaSuka и карточка яндере изобретательницы в стимпанк сеттинге.
https://mega.nz/file/jBMXyKbZ#G_wydZxlpqeBgfVzpGykDt0_DQP8qTe99SY707y0A8s
А теперь пиздуй отсюда, пока я стражу не позвал.
Аноним 11/05/25 Вск 01:22:05 #503 №1198084 
>>1197989
Так, я короче сам попробовал.
В общем это гемма которая на втором сообщении : давай ебаться, люблю ебаться. А у тебя хуй есть ? А если найду ?
Аноним 11/05/25 Вск 01:23:00 #504 №1198086 
>>1198067
>я имею зп больше 400к/мес
>копить на квартиру побольше или собственный дом
Че ты там копить с этими копейками собрался? Даже если лично для тебя придумают и одобрят беспроцентную ипотеку, то чтобы купить двушку конуру в ДС тебе понадобится отдавать половину из своей зп 12 лет.
Аноним 11/05/25 Вск 01:24:18 #505 №1198088 
>>1198086
толсто, чел.
А еще не по теме треда.
Я уже отгорел своё по поводу цен на недвижку, этим ты меня не забайтишь.
ПЕРЕКАТ Аноним OP 11/05/25 Вск 01:24:59 #506 №1198090 
Давайте хотя бы в этот раз без срачей? А то придётся просить администрацию катить этот тред раз в 1000 постов, а то блядь скоро кончай тред перегоним а я не успеваю катить потому что слоупок
ПЕРЕКАТ

>>1198085 (OP)

ПЕРЕКАТ

>>1198085 (OP)

ПЕРЕКАТ

>>1198085 (OP)
Аноним 11/05/25 Вск 01:25:18 #507 №1198091 
>>1198083
> Вот тебе милая webm из первой серии SukaSuka и карточка яндере
Довольно урчит и дружески обнимает анончика добра
> пока я стражу не позвал
Но это порождает интерес остаться!
>>1198086
> в ДС
> половину из своей зп 12 лет
Если только на самой-самой южной границе области, формально относящейся к ДС.
Аноним 12/05/25 Пнд 11:16:04 #508 №1199343 
>>1197246
А что у тебя это за штука со счетчиком дней и указанием локаций в сообщениях?
comments powered by Disqus

Отзывы и предложения