Тэги 2.0

05.05.2008 20:50
Обновил spectator.ru.

На этот раз — про тэги.

(См. также)


У меня в ЖЖ увидел. Только у меня было вежливее:
«если вы нехороший человек, идите нахуй отсюда».
kukutz
(грозно) NDA!


=)

Автор ответил:
Я же не выдал, что мы русский лолкэтс делаем.
Идею текстового интерфейса не у Раскина, случаем, позаимствовал?

Автор ответил:
Это кто?
Интересно было бы задачу расставления связей между тэгами тоже возложить на массу. То есть 215 идиотов на Одноклассниках регистрируют 204 школу, 204 шк., шк. 204, школу 204, гимназию №6 и Горностай, а двое нормальных приходят, видят весь этот бардак, берут метлу и прописывают, что это всё — одно и то же. Назавтра 215 идиотов просыпаются и находят друг друга.

Возможная проблема: злонамеренный или достаточно распиздяйский юзер прописывает какую-нибудь неправильную связь. Возможное решение: действия юзеров собираются в ленту по типу RecentChanges. Со временем на ней собирается критическая масса RecentChangesJunkies, которые поддерживают систему. Вики, однако.

Автор ответил:
>Интересно было бы задачу расставления связей между тэгами тоже возложить на массу.

Не интересно. Успешного массового сервиса без модераторов не бывает. Если он при этом не срёт в лицо пользователю, конечно же.

Дима, ататат! :)

Автор ответил:
Ты шесть ошибок в слове «акваланг» допустил.
Agon
Простой интерфейс, ха! Тут мне на днях шеф впаривал, что интерфейс, в котором можно в текстовом поле вместо даты вписать «через пять дней» нереально крут, а мой интерфейс, в котором все такие стандартные ситуации стоят рядом, ввиде простого кондового dropdown — ацтой и нирулит. Хотя, что проще — написать три слова или выбрать пункт в списке?

Автор ответил:
Развивая идею: что проще — написать 30 слов или выбрать 30 пунктов?
fillest
yurikhan, т.е. модераторы контролируют расстановку связей юзеров?
Дима, это улучшенный вариант, имхо. или нет? тут вроде получается, что от модератора требуется еще меньше действий

Автор ответил:
Сначала перепроверить пользователей, а потом сделать всё, что он и так должен был сделать. Меньше, ага.
fillest
аа, нет. ему же придется это делать постоянно, а в первоначальном варианте нужно только один раз проставить связи, ну и переодически связывать новые теги, и все

Автор ответил:
Конкретно про одноклассников я уже писал, что там нужно сделать: http://nudnik.ru/entry/3492
За интерфейс зачёт.

У меня очень похоже в e2 описывается всё что нужно для работы поиска по настройкам.

Главное, Дима, сделать нормальное огромное белое поле ввода, без красных пунктирных рамочек, как ты любишь иной раз :-)

Автор ответил:
Поучи меня делать огромные белые поля, ага.
Дмитрий Смирнов 2.0 RC
> Стоимость разработки этого интерфейса стремится к нулю.
Ага, особенно с учетом необходимости при парсинге учитівать, что пользователь может ошибиться и тд, т.е. все нестандартніе ситуации нужно как-то обрабатывать. А их будет много, раз интерфейс примитивный.

Автор ответил:
Простое правило: «несуществующие тэги игнорируем» и всё.

Отсекает все опечатки. После сабмита пользователь видет тэги без связей и понимает, что что-то упустил.

непонятно, схуяли там у тебя ссылка на labs.google.com?

Автор ответил:
Потому что у Яндекса нет Labs.
Дмитрий Смирнов 2.0 RC
> После сабмита пользователь видет тэги без связей и понимает, что что-то упустил.
Потом ругается, заносит данные снова — снова опечатка! ТУт вспоминается мать разрабботчика и мать самой работы. Ну и так далее. Очень улвекательное зрелище будет.

Автор ответил:
А потом модератор увольняется и набирается тот, кто умеет писать и читать.
Дмитрий Смирнов 2.0 RC
> А потом модератор увольняется и набирается тот, кто умеет писать и читать.
Таких людей мало и на всех не хватает.
Т.е. Яндекс себе такого человека найдет, а для стартапа будет проще потратить день и написать админку посложнее.

Автор ответил:
Для стартапа проще сесть и самому все промодерировать.

А лучше инвестора искать, чем админки писать посложней.

Дмитрий Смирнов 2.0 RC
Кстати, у того, кто умеет читать и писать, тоже будут опечатки, лол.
Все правильно говоришь. + В форме ввода тэгов сделать автозаполнение (suggestions) и работа модераторов облегчится и всем будет еще лучше =)
Всё понятно кроме «киска», или я невнимательно прочитал.
Киска это ведь синоним как домашнего животного так и дикой пизды.
В случае если модератор отнесёт его к кошкам получится фоторесурс, а в случае если к женщинам — эротического уклона.

Автор ответил:
Если модератор знает, что он модерирует фоторесурс, он отнесет ее к кошкам.
Дмитрий Смирнов 2.0 RC
Лучше быть богатым и здоровым.

После того, как инвестор найден, нужно тоже что-то делать, а не колупаться с опечатками.

Автор ответил:
После того надо Пиариться. И показать инвестору Облако Тэгов.
Дмитрий Смирнов 2.0 RC
> После того надо Пиариться. И показать инвестору Облако Тэгов.
Тогда вообще никакой умной системы тегов не нужно, Облако можно и в нотепаде нарисовать!

Автор ответил:
Ну вот видишь, сам все прекрасно понимаешь. К чему тогда это всё?
Очень хорошо.
andr
И как быстро пересанут фрустрироваться пользователи, генерирующие свои уникальные теги?

Автор ответил:
После первой замены «кисок» на «кошек».
> Если модератор знает, что он модерирует фоторесурс, он отнесет ее к кошкам.
Замечательно. Т.е. с явлением омонимов недрогнувшей модераторской рукой. Скажем нет коллизиям.
Осталось разобраться с названиями различных объектов а-ля «У Котофеича» и «за косой» и можно продавать. Хотя да, можно оставить за пользователем творческую составляющую — для этого пусть вставляет в кавычки.
Можно тогда оставить и «киска» для особо упёртых, причём это даже будет отдельным тэгом.

Автор ответил:
Вообще-то задача разобрать тэги, которые попадаются в единственном экземпляре, не ставится.
Дмитрий Смирнов 2.0 RC
> Ну вот видишь, сам все прекрасно понимаешь. К чему тогда это всё?
Поговорить о том, как все должно быть в Идеальном мире.
В нашэм вэб-проэкте тэги, ага.
Повелитель Женских Попок
!ajax / iframe / layer / center
!javascript / eval / innerHTML
руки = ноги
жопа = голова

(c) Автограф по Смирнову

CMEPTb
Уважаемый, поясните, пожалуйста, к какому корневому тэгу будет относиться пользовательский тег — «с косой»?
Повелитель Женских Попок
косодержец, очевидно.
Я, кстати, давно силюсь представить себе сливки с говна. В результате эсхалотических размышлений, я понял, что сливки с говна — это, собственно, ноосфера.
LXj
А ничего, что название рубрики + отображение связей занимает больше места, чем сам контект? И у категорий, и у тэгов есть тот плюс, что их можно тупо перечислить в строчку.

По мне так вполне достаточно дерева категорий, при условии, что одному entity (заметка/фотка/etc) может соответствовать несолько категорий. Собственно, такие категории и сделали в вордпрессе, а потом уже для леммингов добавили тэги. Зачем вообще тэги нужны в stand-alone блогах — это выше моего понимания.

Хотя в специфических случаях наличие и тэгов, и категорий вполне оправдано.

Автор ответил:
Ничего не мешает перечислять конечные категории через запятую, как и тэги (т.е. писать просто «кошки», а не «животные /…/ кошки».

Да, и потом надо читать внимательно: «Речь пойдет о тэгах на массовых сервисах».

Ах да, забыл комментарии по теме.
Комментарий номер один — автозамена на «правильный». Для юзера правильный — тот который он ввёл сам или выбрал из предложенного. Так как юзера ничего никогда не ищут, то сработает должным образом только автоподстановка, которая на «кош» выдаст список «коты», «кошки», «кошечки», в надежде, что юзер выберет нумер 1, то есть коты. Ибо если он выберет «кошки», значит it matters, и попытки заменить на «коты» он примет за ошибку системы.
Ну и, наконец, всё это хорошо, вплоть до момента, когда классифицировать начинают модераты, и появляется вопрос: «а кто снёс яйцо, из которой появилась эта курица?»
Научить классифицировать модераторов ничуть не легче, чем обычных юзеров, в плане методологии. Например, даже в твоём примере царит некая отпотолочность и бессистемность. С каких это пор «ню» является подкатегорией «люди»? Каким критерием ты пользовался, что у тебя в одном ранге оказались «я», «ню» и «дети»?

Автор ответил:
В автоподстановке есть только «кошки», разумеется.

«Я», «ню» и «дети» — не в одном ранге, просто они все «люди». Ты же не будешь это отрицать? Понятно, что ню — такая тема, которую из-за особенностей восприятия надо выносить отельно.

Буду отрицать. Если я и дети — это ещё как-то люди, то ню — это жанр искусства, а никак не люди. Просто он изображает людей, да и то не всегда (есть, например, экзотическое ню, где половые органы изображают фруктами или пейзажем).
Суть не в этом. Суть в том, что хороший таксономист и методология — мэйн флос оф ё дизайн. Почитай о проблемах методик классификации сказок у Проппа, очень познавательно.

Автор ответил:
>хороший таксономист и методология — мэйн флос

Поэтому давайте доверим это все массе пользователей.

> Читать: http://nudnik.ru/entry/3558#3839
Нет конечно, пойнт не в этом. UGC — это крэп, который отомрёт сам, оставив пару интересных артефактов. Я говорю о том, что проблема не в интерфейсе ввода слов, синонимах и т.п. — это технические мелочи. Проблема в отсутствии ВНЯТНОЙ МЕТОДИКИ построения онтологии информационного шума под названием «краткое описание моего фото».

Скажем, фото, на котором изображено облако в виде собаки — это «животные», «природа», «пейзаж», «искусство» или всё сразу? И если юзер этому фото приписал категорию «я», то что должен делать одминестратог с этим фото и его ключевыми словами? Какой именно методикой он должен пользоваться, чтобы отмодерить подобного пидараса?

Тима Люмин
> У меня в ЖЖ увидел. Только у меня было вежливее:
> «если вы нехороший человек, идите нахуй отсюда».

Фейс-контроль: если у вас уродливое лицо, не читайте этот текст.

lexazloy
Не понимаю. Ведь ты просто подменяешь понятия.

Теги это фолксономия. Древовидные теги не могут быть фолксономией. Да, именно потому что «древовидные». Значит это не теги. А у тебя получается, что это работает как теги, выглядит как теги, но это не теги. Ты же взорвёшь мозг всех пользователей «Яндекс.Фотки».

Картинко http://spectator.ru/img/fotki_tags.png. Очевидно, что городские пейзажи это пейзвжи, но пейзажи даже городские — не город. Ты неверно категоризируешь. В этом изначальная проблема тегов. Их _все_ расставляют на _свой_ лад. И ты не исключение.

Чётким на сайте должны быть категории с древовидной структурой и создаваться только Теми, Кто Допущен. При этом должно учитываться и направление сайта чтобы определить что есть игры — это софт или развлечение.

У тегов же модераторы должны только синонимы отмечать.

Короткий вариант.
Древовидными и точными должны быть только категории.
Теги пользователя под фоткой Авы Девайн дожны быть тегами пользователя. Уж что-что, а строить дерево по собственному усмотрению из тегов (дак как их не назови) поставленных из усмотрения пользователя это полный писец.

На счет модерируемых категорий и связей абсолютно согласен. В книготорговой классификации для этого привлекали много разных экспертов (не только методистов, но и бизнесменов с маркетологами и мерчендайзерами).

Только я не верю в возможность классифицировать практически все сущности в единой системе. Не получится. Особенно, если все сводится не к смысловому, а к словесному описанию.

Ну и классическое: помидор — это овощ или ягода? И что является главным синонимом: «помидор» или «томат»?

Автор ответил:
Кто говорит про «или»? Помидор — это овощ И ягода.

Главным синонимом является помидор («помидор» употреблятся примерно в 3 раза чаще).

zee
Есть значительное допущение в части рассказки про корневые синонимы.
Что же мне делать, если мои друзья A, B и C знают только языки русский, английский и китайский соответственно?
При этом я НЕ хочу:
cats -> кошки
киски ->cunts
и т.п.

Автор ответил:
cats = кошки
вагины = cunts
> «Корневых» тэгов, из которых можно попасть в остальные, получилось всего 8 штук.

- Огласите весь список, пожалуйста

Дима, а как в такой системе будет выглядеть облако тегов? Выводить в него только теги-листья (не имеющие потомков), или считать всю цепочку «природа / животные / домашние животные / кошки / котенок»? Я склоняюсь ко второму варианту, но очень уж громоздким он мне кажется.
Чтобы комментировать, надо войти или сначала зарегистрироваться.
А если у вас есть OpenID, это еще проще: