Комментарий #3215911

morr
@Aniki, "только чистых представителей жанра" можно задать лишь вручную, списком id. это сложно, нужно слишком много ручной работы, особенно с учётом того, что каждые 3 месяца появляются новые аниме, и список придётся постоянно актуализировать, особенно с учётом того, что никто не смотрел все_существующие_аниме, и соответственно список будет базироваться лишь на том, что смотрел/о чём слышал составлявший список.
про увеличение порога. у это ачивки ведь есть уровни, и увеличение порога для них и так уже должно использоваться

вообще подобная история должна происходить и с остальными жанровыми ачивками. хорошо бы по возможности выбрать универсальные критерии для всех жанров, но для самых популярных жанров типа комедии процент наверное должен быть ниже
1й уровень - такой-то процент
2й уровень - такой-то процент
и т.д.

общую выборку аниме можно попробовать сократить следующим образом
1. ограничить датой выхода. например, только аниме после 1990 года выпуска, или 1985, или 1980го.
2. ограничить рейтингом. можно выкинуть всё, что имеет рейтинг ниже, например, 6.5
3. ограничить возрастным рейтингом. например не учитывать аниме с рейтигом G. или не учитывать аниме с рейтигом G и жанром Детское
4. не учитывать спешиалы
5. не учитывать OVA с рейтингом R+ (вот пример IS: Infinite Stratos Encore - Koi ni Kogareru RokujuusouБесконечные небеса OVA)
с пятым пунктом возможно какие-то другие критерии надо взять. возможно, учитывать ещё год выпуска. тут дело в том, что сейчас OVA выпускают просто как дополнительный эпизод к основному аниме, а раньше в 80х-90х годах подобные OVA были полноценными аниме
6. 7. 8. ещё какие-то критерии, по которым можно выкинуть аниме

как подобрать нужный процент для конкретного уровня?
либо как в голову взбредёт, и любая цифра будет ничем не обоснована, либо попробовать выработать какую-то методику.

начать можно с того, что нужно решить, а сколько ачивок мы хотим выдать типовому пользователю сайта.

средний размер списка активного пользователя сайта (взял тех, у кого размер списка > 30) - 260, а медианное значение - 165 (у половины пользователей список < 165, а у половины > 165)
если брать вообще всех пользователей, то средний размер - 147, а медианное значение - 46

и вот берём "типового пользователя" с размером списка 260 аниме (тут надо подумать а какую цифру брать, среднюю или медиану. пожалуй, всё же медиану, и тогда не 260, а 165).
дальше надо взять все аниме, за которые будем давать ачивки (фильтрация по пяти пунктам, про которые я писал выше). (посчитать сейчас не могу, пока критерии фильтрации не определены)
например, таких получилось 5000. для них считаем процентное соотношение жанров. например, из этих 5000 имеющих жанр комедии оказалось 30%.
возвращаемся к типовому пользователю со списком в 250 аниме. т.к. мы посчитали, что во всей базе аниме 30% - это комедии, то у "типового" пользователя сейчас 250 * 0.3 = 75 комедий.
теперь надо решить, что мы хотим дать пользователю за эти самые 75 комедий. уровней ачивок у нас пять? наверное тогда 2й или третий 3уровень. скорее третий.

для первого уровня можно взять медианный размер списка всех пользователей 46 (ещё наверное уменьшить это число, где-нибудь на треть-половину?). для этой цифры можно повторить предыдущую методику, чтобы получить цифры для 1го уровня жанровых ачивок.
чтобы пользователь который только-только начал смотреть аниме уже имел возможность получить ачивку первого уровня.

для второго уровня берём промежуточное значение между цифрой для 1го и цифрой для 3го.
для пятого уровня эти самые 75 увеличиваем в... 4 раза?
для четвёртого уровня берём промежуточное значение между цифрой для 3го и цифрой для 5го.


p.s. для ачивки за размер списка можно применить подобные же рассуждения. первоначальная цифра в 50 получается слишком большой. у половины пользователей сайта нет списка такого
p.p.s. перечитал, и понял, что кое-что не учёл. Если выдавать ачивки только за отфильтрованные аниме (те самые 5000 из 13000 что составляет 38% от 13000), то и за размер списка нужно брать значение умноженное на эти 38%
p.p.p.s. чтобы проще было рассчитывать, можно сделать отдельный таб тут docs.google.com с формулами. чтобы в них можно было вбить общее число аниме, число отфильтрованных, число аниме определённого жанра, и чтобы оно посчитало какие цифры должны быть для соответственующего уровня
Ответы
4-1-|2 g-e-a-r
4-1-|2 g-e-a-r#
уровней ачивок у нас пять?
Четыре.
Aniki
Aniki#
"только чистых представителей жанра" можно задать лишь вручную, списком id
Я думал чисто о комбинациях фильтров: комедия + романтика, комедия + пародия, комедия + повседневность. И из каждой пары по отдельности, какие то жанры вычитать.
Ну или хотя бы вариант полного списка с тегом "комедии", за вычетом отдельного списка тайтлов. Список могу составить. (думаю не много времени займет взять связку комедия+драма и пробежаться по первым 100-200 тайтлам топа в поисках неподходящих)
хорошо бы по возможности выбрать универсальные критерии для всех жанров
Не получится. МАЛовцы тоже отказались от универсальности, теперь у них уровни в % от числа представителей.
У романтики и повседневности очень высокий порог, а у махо-седзе и космос заниженный по сравнению со средними.

для ачивки за размер списка можно применить подобные же рассуждения. первоначальная цифра в 50 получается слишком большой. у половины пользователей сайта нет списка такого
Ориентируешься по базе пользователей?
Из них же много незаполненных профилей, забаненных троллетвинков и так далее.
Для активных 50 комплитов уже легкий порог: возьмем полнометражки Гибли, новые сериалы, последняя серия которых часто числится в базе спешлом, маркетинговое дробление на сезоны целого сериала и.т.д. И уже 50 есть.
Как вариант, можно выдавать символическую приветственную за первый комплит и первые уровни давать за каждые 50
1/ 50/ 100/ 150/ 200, а дальше по сотням 300/ 400 и т.д.
не стоит. многовато ачивок получится.
На сколько жанровых ачивок примерно рассчитываешь?
World_Houp
World_Houp#
общую выборку аниме можно попробовать сократить следующим образом
1. ограничить датой выхода. например, только аниме после 1990 года выпуска, или 1985, или 1980го.
2. ограничить рейтингом. можно выкинуть всё, что имеет рейтинг ниже, например, 6.5
3. ограничить возрастным рейтингом. например не учитывать аниме с рейтигом G. или не учитывать аниме с рейтигом G и жанром Детское
Какая-то дискриминация. Получается, что хомячки рулят, а если тебе не лень сделать более двух движений мышкой далее чем "смотреть онлайн фандаб онгоингом без смс", то иди гуляй отсюда, ты недостоин.

Мне кажется, вот этот вариант подходящий:
полного списка с тегом "комедии", за вычетом отдельного списка тайтлов.
И от отфильтованного уже брать нужный % по уровням.
morr
morr#
@Aniki, на малграфе помимо количества в жанрах были "мастхэв". То есть можешь хоть три сотни слайсов насмотреть, но без йокогамы следующий уровень не возьмешь)
нет. вот пример github.com
531x590 644x345

Не получится. МАЛовцы тоже отказались от универсальности, теперь у них уровни в % от числа представителей.
У романтики и повседневности очень высокий порог, а у махо-седзе и космос заниженный по сравнению со средними.
У них задан не процент, а количество github.com
492x668

и о том, как можно рассчитывать количество я в предыдущем @комментарии и писал
morr
morr#
Какая-то дискриминация. Получается, что хомячки рулят, а если тебе не лень сделать более двух движений мышкой далее чем "смотреть онлайн фандаб онгоингом без смс", то иди гуляй отсюда, ты недостоин.
критерии можно поменять, их для примера, как можно было бы сделать, привёл. но вообще да, смысл именно в дискриминации, чтобы спешиалы, пляжные/бассейновые OVA'шки и разные аниме про червяков на ачивки не влияли

И от отфильтованного уже брать нужный % по уровням.
что процент, что конкретная цифра, это не суть важно, фактически это одно и тоже. количество легко перевести в проценты.
весь вопрос в том, как рассчитать конкретную цифру конкретного уровня ачивки, об этом в предыдущем @комментарии и писал
Aniki
Aniki#
Мне вообще интересна общая статистика по сайт. Например сколько тут power user'ов с большими списками и т.д.
Выше по треду Морр, пытался высчитать среднестатистического юзера шики, получилось что:
средний размер списка активного пользователя сайта (взял тех, у кого размер списка > 30) - 260, а медианное значение - 165
В общем, совсем несущественные циферки у большинства.
Все в одну кучу, где банально 2-3 сезона и уже ачивка
Помнится, я тогда топил за 3 нелинейных сезона и 5 минимальных позиций в целом, т.е. 3 сезона + спешлы/ОВА
назад
Твой комментарий
Вернуться к редактированию
Предпросмотр
Скрыть