От создателей Блоговара!
 вебдев  смотрите также
 поисковики 
 php  (+2)
 хостинг 
 rss 
 javascript 
 gzip 
 usability  (+1)
 mysql 

Полуавтоматическое добавление тэгов

06.09.2008 14:35
Полуавтоматическое добавление тэгов сделать можно. Но, конечно, совсем не так, как предлагает автор — по частоте. Например, слово тэги будет не самым частым в этом посте.

Там же в комментах умники заговорили про иерархию: «Одно из решений (не дающее 100% резульата). Создание каких-либо зависимостей или даже иерархии. Например для тегов водка, бухать, нажраться и пр. родительским тегом будет „пьянка“. Однако это здорово усложняет систему и, как уже упомянул, сто процентного результата все равно не дает (плюс неясно как заполнять эти связи)».

Совершенно понятно, кстати, как связи заполнять.

Системе это, однако, не очень поможет. Ну а правильная расставлялка тэгов делается так: берем несколько корпусов текстов, проставляем им тэги вручную. После чего натравливаем на это байесовский фильтр, который обучается N раз, где N — количество тэгов.

То есть по аналогии с «это спам? Да/нет» — для чего байесовский фильтр часто и используется — обучаем его «это про кошечек? Да/нет».

Ну и надо помнить, что новые тэги такая система проставлять не будет, что хорошо. Ибо зачем нам тэг «Байес», например, этому посту? Нафиг не нужен до тех пор, пока это единственный пост с таким тэгом.

Да и вообще — тэги сосут.

Удаление постов: как?

31.07.2008 20:15
Задача: как сделать так, чтобы пользователи могли редактировать комментарий и при этом никого не травмировали.

1. Diff (ревизии и версии) не работает, честно. Он даже в вики не работает. Даже если бы он работал, никто не полезет сравнивать отредактированный комментарий с конечным. Более того — даже конечный комментарий не факт, что прочитают.

2. Любые методы «через N минут…» не работают, ибо N для всех разный, зависит от размера поста, времени твоей реакции, скорости связи, скорости дискуссии, времени реакции других пользователей.

3. Способ «не публиковать сразу, а публиковать через N минут, зато N минут давать редактировать» тоже не работает (ибо N), к тому же сводится к более простому и более раздражающему способу: публиковать только после предпросмотра. Это хороший способ избежать опечаток, кстати, то есть для предотвращения необходимости редактировать. С другой стороны, можно обойтись без фашизма и сделать опциональную кнопку «предпросмотр». Что тоже уже у многих есть.

4. Способ «давать дописывать только в конце» кажется правильным, но только на первый взгляд: функционал «дописывать в конце» на самом деле называется… «написать новый комментарий». А такой функционал уже есть.

5. Да, кстати, «исправить пост и поднять его наверх, чтобы видели» тоже описывается через функционал «удалить и написать заново».

6. Хотя, если уж на то пошло, удаление комментариев — тоже не безвредная процедура, по понятным причинам.

7. «Запретить исправлять более 10% символов, а так же добавлять и вычеркивать частицу „не“» — этот способ попахивает созданием универсальных антиматерных фильтров, которые, как известно, только все усугубляют. Модераторы — тоже не выход, те же фильтры, но человеческие, более дорогие и менее надежные.

А теперь — правильный ответ.

Конечно же, редактировать комментарии давать не нужно. И удалять тоже. Это фашизм, но для вашего же блага. Не сопротивляйтесь. Можно сделать опциональную (а вот это не фашизм) кнопку «предпросмотр».

Если же вам действительно очень-очень нужно дать редактировать, или у вас все-таки есть возможность удаления, то все проблемы с «подделкой» смысла решаются просто: подписью «этот пост редактировался автором».

То есть, вместо удаления поста, автор сможет переписать его, фактически, «удалить и написать новый», просто в другом интерфейсе, в виде «редактирования».

Тэги 2.0

05.05.2008 20:50
Обновил spectator.ru.

На этот раз — про тэги.

(См. также)

OpenID и гики

21.04.2008 01:39
До меня дошла недавно одна очень смешная вещь. Прямо-таки откровение.

OpenID — это не технология для гиков. Для конечного пользователя весь интерфейс работы с OpenID сводится к одному полю, где надо ввести URL. Или к одному полю, где надо ввести логин и одному dropdown-у, где надо выбрать один популярный сервер из списка. И всё.

Такое поймет даже моя мама.

Если пара-тройка крупных порталов (вам имена назвать, или вы сами понимаете, о ком я?) возьмет и молча прикрутит OpenID себе (а потом начнет пиарить), то это тупо отоварит процентов 90% аудитории интернета OpenID.

Васе Пупкину везде будет достаточно указывать, грубо говоря, «я pupkin на mail.ru» (ну вот, имя назвал).

Просто так отдельно стоящий провайдер OpenID — действительно вещь для гиков. «Зарегистрируйся у нас и получишь OpenID» — это чё, зачем и кому?

Однако ж, похоже, потенциальные провайдеры OpenID ждут, пока везде начнут поддерживать OpenID на принимающей стороне. Этого, естественно, не будет: зачем массово поддерживать вещь для гиков?

Надо кому-то (и под «кому-то» я понимаю провайдеров) просто собраться, нарисовать кнопки «openid enabled», сделать нормальные OpenID’шные урлы, которые не ведут «в никуда», и начать потихоньку продвигать.

С RSS, кстати, отдающая сторона тоже начала первой.


***

Если кто пропустил: Голосуй сердцем @ spectator.ru

Смотри также:
OpenID @ Nudnik.ru
OpenID и яндекс

Wiki 2.0

09.04.2008 22:47
Написал про вики, вики-форматирование и прочую ерунду.

Специально для Кости.

Баксокарма

22.01.2008 21:03
Некие (видимо, хорошие) люди попросили у меня придумать им «карму» на сайт (ссылку дам, как запустят). Ну, я придумал за 2 часа вечерком (идею просьба не тырить, пока не заплатили).

Разрешение на публикацию, однако, есть (информация должна быть свободной, ага). Главный вопрос — сколько это может стоить? То есть сколько просить бабок за мой офигенный талант «и все такое»?

ПОСТАНОВКА ЗАДАЧИ:

Сделать на «вебдванольном» сайте систему поощрения активности пользователей, некий рейтинг, за который будут выдаваться раз в месяц реальные призы.

АКСИОМЫ:

1. Карма — не позитивна, так как быстро превращается в механизм наказания и чморения («карму заминусовали»).
2. Валюта — позитивна, так как насильно отобрать бабки ни у кого нельзя. Но делиться бабками можно. А делиться — это позитивно.
3. Для любой виртуальной экономики главное — отсутствие инфляции («удешевления денег»), поэтому нужен прежде всего money sink (средство для слива денег).
4. Система не должна поощрять одних и тех же людей постоянно.

ВАЛЮТА И КОШЕЛЕК

Валюта — баксы с центами. Название не принципиально, главное — с центами.

У каждого пользователя есть максимальный размер кошелька. По умолчанию он равен 100$*. Все поступления выше максимального размера кошелька пропадают «в никуда».
Когда пользователь «дает бакс» другим, максимальный размер его кошелька увеличивается на 1$.
Когда пользователь тратит деньги на аукционе, максимальный размер его кошелька уменьшается на такую же сумму, но максимальный размер кошелька не может быть меньше 100$.
Максимальный размер кошелька — это просто потенциальная его вместимость.

«ДАТЬ БАКС»

Каждая сущность, у которой есть автор («пост», «статья», «комментарий» и прочее) имеют следующую кнопку: «+1» (видимо, с изображением монетки) и сколько денег всего заработала эта сущность всего.

При нажатии на кнопку «+1» с твоего кошелька списывается 1.1$*, на кошелек автора зачисляется 1$, максимальный размер твоего кошелька увеличивается на 1$.

Один пользователь может «дать бакс» одной сущности всего один раз. Дело это анонимное.

ЗАРАБОТОК ДЕНЕГ

Заработок денег — это «невидимая» часть. Логично, что для того, чтобы бабками делиться, нужно их зарабатывать.

За каждый не-твой комментарий к твоей комментообразующей сущности (твоя сущность = там, где ты автор, если это форум, то твоя сущность — это тред, который создал ты) тебе зачисляется 30 центов*.

Заработанные деньги тупо и молча поступают в кошелек, логи не ведутся. (Лучше вообще зачислять их раз в день, чтобы людям меньше было информации «за что и сколько дали»).

МОДЕРАЦИЯ

Модераторы тоже могут давать бакс, на общих основаниях (бакс за сущность), только баксы у них не кончаются. При удалении сущности баксы («сколько денег заработала эта сущность всего» и 30 центов*, если это комментарий) удаляюся со счета игрока. Те, кто эти баксы давал, обратно ничего не получает. Вот вам и борьба с накрутками.

То есть вся модерация — это обычное тупое удаление, как и обычно. Просто бабки отбираются.

КАК ЭТО РАБОТАЕТ

В конечном итоге для пользователя все сводится к одной кнопке «+1» везде (One button to rule them all™). Нажимать на нее полезно, потому что максимальный размер твоего кошелька растет.

В профайле можно посмотреть свой кошелек и его заполненность. Виртуалы могут хоть занажиматься на «+1» — пока у них нету бабок, это не работает. Если какой-то дурак вдруг заведет активного виртуала — ну и пусть, это полезно для сайта.

АУКЦИОН

Раз в месяц на аукционе разыгрываются ценные призы.
Аукцион — это money sink. То есть человек накопил бабки, слил их все за месяц (люди азартны) — выиграл приз. В следующем месяце у него 0 баксов — появляется шанс выиграть на аукционе у других.

Добавление от авторов сайта:

делать аукцион раз в месяц большой, скажем, 3 лота от спонсора
и раз в неделю в пятницу ящик пива
ты бы повёлся? :)

КОНСТАНТЫ

* — с этим значением можно поиграться.

OpenID @ Nudnik.ru

06.12.2007 01:36
OpenID — это система валидации УРЛа, и ничего более. Это не паспорт, то есть ваши данные там могут хранится, но вовсе не обязаны.

Поэтому единственное нормальное использование OpenID — это в качестве «заменителя пароля». У вас спрашивают не пароль, а УРЛ.

На этом сайте теперь понимается OpenID. Если у вас уже есть тут аккаунт, то достаточно залогинится старым способом и в настройках в качестве сайта указать этот самый УРЛ — и сюда можно будет заходить по OpenID.

Если аккаунта нет, то при первой попытке логина по OpenID этот аккаунт создатся сам, и его тоже можно будет редактировать. (Например, вписать email, на который будут приходить ответы автора).

Имей хороший день.

Смотри также:
OpenID и гики
OpenID и яндекс

Однокласники .ru

30.11.2007 16:51
Оказывается, одноклассники.ру — какое-то невероятное вебдванольное гавно. Я-то, по простоте душевной, думал, что миллион леммингов не ошибается, и сайт хороший.

Кто ж дает пользователям всё указывать самим? В результате городов Новосибирсков там 16 разных штук. «Левые» Новосибирски в формате «Новосибирск в/ч 3287 сержантская учебка» — хрен с ними, военные, мозгов нет, но «город Новосибирск» и просто «Новосибирск» тоже есть.

Года учебы в виде выпадающего списка из ста вариантов (1910–2010) — удачная находка. Это проще, чем вбить четыре цифры.

«По-правильному» следовало бы посадить одну специально обученную девушку баксов за 500, дать ей примитивные инструменты («„школа 7“ и „7“ имеют 80% общих пользователей, слить их?») и — вперед.

Но нет, вебдваноль же. «Пользователь делает все сам». Даже фотографии предлагают модерировать самим же пользователям.

Сайт оставляет тягостное впечатление отсутствия мыслительного процесса при его создании. Поддержка девичьих фамилий нет, самые умные пишут их в скобках, но в поиске по фамилиям оно не находится. В «моих гостях» (те, кто просмотрел мою анкету) — я сам. Варианты, типа «Н-ск» и «город Н-ск» отсекаются простой заменой на этапе ввода и вообще — autocomplete-ом (которого там нет). И так далее.

(Самое ужасное — это клоны сайта. Которые, конечно же, есть. И которые, конечно же, скопировали весь этот маразм и «оптимизируют» сайт по поисковому запросу «однокласники»).

Такого насёра в душу я, как пользователь, давно не видел. Нет, серьезно. На сайте неудобно до омерзения.

Идея, впрочем, работает, ибо для ее работы нужна тупо масса народа, и ничего более. И чем масса больше — тем лучше.

Забавно, что у 50% найденных там одноклассников место жительства — Москва «и выше». (Даже Болк туда собрался, хотя какой он мне одноклассник).

Жена говорит, что там регистрируются только из желания повыебываться. Я все-таки верю в простые человеческие ценности — любовь, дружбу, скуку, «все побежали и я побежал».

Трех человек, ради которых я туда и полез, я там не нашел.

Ну и да, privacy — совсем не наш концепт.

***

Елена Шкарубо, вместо того, чтобы всерьез воспринимать меня, как сексуальный объект, зачем-то пишет про какие-то глупые выборы.

Несмотря на симпатии, моя гражданская позиция последние 10 лет не меняется: я не голосую.

Белогривые лошадки

26.09.2007 12:42
Я монетизировался, ура. Подробности в конце поста.

Про облако тэгов хотелось бы понудеть.

Движки, которые выводят облако тэгов на каждой странице, не кэшируя его — ущербны. Например, Wordpress генерирует страницу «пост с комментариями» с помощью 28 (!) запросов к базе данных. Поэтому посещаемые сайты на wordpress-е (не будем показывать пальцем) тормозят безбожно.

Совершенно же логично, что для генерации поста с комментариями — например, в этом блоге — нужно максимум три MySql запроса: 1) вывод поста, 2) вывод комментариев, 3) вывод навигации «Вы сейчас здесь».

Облако тэгов, само по себе — идиотская идея и ненужная фигня, типа календарика. Основная ее «фишка» в том, чтобы вывести список и по алфавиту и по «важности» (выделив это размером).

Тут и кроется самый смешной нюанс — тэги у всех разные. Натурально, разные слова. Начинаются на разную букву. У кого-то ключевое слово «имбецилы», у кого-то — «идиоты», а тема-то одна и та же. Не говоря уже о том, что везде наблюдается смесь английского и русского, которая довольно нелепо сортируется по алфавиту.

От сайта к сайту «оно всё разное». Запоминать ваши тэги/ключслова ни один посетитель не будет, не обольщайтесь. Сортировка по алфавиту бессмысленна.

Сортировка по дате чуть более осмысленна, но а) интуитивно не понятна, б) часто пересекается с сортировкой по популярности (логично же, что чем больше постов по теме X, тем больше вероятность, что про эту тему недавно писалось, в) последние ключслова и так находятся под заметками на первой странице.

«Там решено было цветом выделять последнее, хорошая мысль» — мысль вовсе не хорошая. Цветом нужно выделять только посещенные ссылки. Это принятно, интуитивно понятно, и, что самое главное — это гораздо полезней. Разноцветные ссылки — никому не понятное уебище. Даже если и подписано «Bright Color = Newer» — я захожу на сайт читать, а не оттенки цвета угадывать.

То же самое и с размерами — размеры шрифта — показатель на самый точный. Сколько разных и различимых размеров можно запихать в одно облако? Десяток максимум. Сложнее всего быстро пробежать все «облако» глазами, ибо глаз в любом случае застревает на самых крупных элементах и дальше не идет. И это не плюс, это минус.

Никому никогда не интересны все ключслова. Потому что часто бывает ситуация, когда есть «случайные» ключслова, принадлежащие одному-двум документам.

Как надо

В своем личном блоге проще всего отобрать штук пять ключслов, которые «наиболее характеризуют». И разместить их любым удобным способом. Например, как у меня справа. Вам самому безо всякой «автоматизации» лучше знать, какие ключслова «круче», без привязки к их частоте.

На массовых «социальных сервисах» облако тэгов неинформативно, но нужно для того, чтобы круто выглядеть, и чтобы пальцем не показывали. И для того, чтобы направить леммингов по ими же протоптанной тропинке. В этом случае можно вместо «букав» просто использовать прямоугольники разных размеров и цветов, так как кликнут все равно на тот, который больше. А надписи никто не читает.

Bonus track

Хранить тэги в таблице надо так:

1. В таблице с постами. Отдельное поле «ключслова через запятую».
2. В отдельной таблице связей, которая имеет вид «ID поста — ID тэга».

Это не два способа, а один, то есть хранить надо и так и так одновременно. Ценой небольшой избыточности информации мы получаем гораздо больший простр для. Минус только один: при редактировании надо редактировать и то и то, разумеется.

И про баб

Весь следующий месяц меня монетизирует cайт бесплатных знакомств. Не знаю, видели ли вы его, но я уже раз в пятый натыкаюсь. Лемминго-ориентированный интерфейс (это плюс), две кнопки «я б ей вдул» и «сам ей вдуй!».

Мне интересно — стоит ли за этим какой-нибудь хитрый алгоритм, или просто rand()? Был же где-то сайт, на котором тебе показывают картинки, а ты выбираешь «нравится» или «не нравится», а в конце о твоей личности делают некие выводы. Находят латентную пидерастию, например.

Вдруг и там так же?

Смотри также:
Головач про классификации
Мода на классификации
N-мерная связь
R2: на 94% меньше ненужной хуйни

Изобретение вебдваноля

16.09.2007 18:28
There was a second part of the dream, too, dependent on the Web being so generally used that it became a realistic mirror (or in fact the primary embodiment) of the ways in which we work and play and socialize.

Вебдваноль изобрел — правильно! — Тим Бернес-Ли.

Он же вел первый блог — сразу после основания интернета.

Это всё к тому, что среда изначально позволяла и предполагала подобные вещи. Просто люди тормозили.

А вообще, продолжая разговор о косяках веба — всё это можно выразить одной простой фразой:

Хотели LaTeX, а получился MS Word.

Гипертекст, веб и html

15.09.2007 08:07
Гипертекст, веб и html @ spectator.ru

Много умных букв.

Как избавиться от спама в форумах и блогах

13.09.2007 19:43
«Палю тему». Способ тупой, но 100% рабочий.

Все авторы (и владельцы) движков блогов и форумов всем внешним ссылкам в комментариях автоматически прописывают noindex и rel=nofollow.

У SEOнистов сразу угасает желание спамить.

(Для тех, кто в танке. SEOнисты — это такие удивительные люди, которые делают все для поисковиков, а не для людей. Даже спамят ссылками ради поисковиков. Банально повышают индекс цитируемости указанного сайта, их не волнует — будут ли люди кликать на ссылки. Если запретить к индексации внешние ссылки, то этот метод работать не будет — не будет желания спамить).

Смотри также:
CSS и борьба со спамом

Пионэры web 2.0

24.08.2007 14:41
Мало кто уже помнит, но первым web2.0 проектом в интернете был dz.yandex.

OpenID и яндекс

22.08.2007 18:33
У Яндекса есть подпольный OpenID сервер.

Это значит, что если у вас есть аккаунт в яндексе (а у кого нет?), то можно на любом своем сайте (в блоге, например) вставить в head что-то типа такого:

<link rel="openid.server" href="http://openid.yandex.ru/server.xml" />
<link rel="openid.delegate" href="http://openid.yandex.ru/users/ваше_имя_пользователя" />

После чего везде, где требуется OpenID, просто указывать урл своего сайта.

Смотри также:
OpenID и гики
OpenID @ Nudnik.ru

Last.fm

16.07.2007 23:06
Один из немногих гениальных сайтов «в стиле web 2.0» — это, конечно же, last.fm.

Гениальность этого сайта заключается в том, что пользователям не дается возможности генерировать этот самый поносный user-generated content.

Вместо этого анализируется отношение пользователей уже к существующему контенту, и на этом основании строятся хитрые связи и чарты. Миллион леммингов дают прекрасный материал для статистики.

В результате сайт довольно успешно отвечает на вопросы, типа «Что бы послушать этакого а-ля Tom Waits?» или «Я не знаю, кто такой этот Tom Waits, какие песни надо послушать, чтобы составить общее впечатление?».

Ajax vs gzip

13.07.2007 18:39
Ajax — незаслуженно раздутая технология. Не, получить ответ с сервера, не перезагружая страницу, иногда может быть полезным. (На skill.ru, например, при голосовании страница не перезагружается, а грузится маленькая хэтэмэлька в iframe, которая выводит окошечко, типа «спасибо, ваш голос засчитан». Сплошной вебдваноль, ага).

Однако, стоит задуматься — почему иногда перезагружать страницу «ломает»? Да потому, что она весит полмегабайта. Ну ладно, четверть.

Я, кстати, видел, как грузятся мои сайты на модеме 14.4 Kbps. Очень шустро грузятся. Картинок на них нет, а сам хэтэмэль ужат gzip-ом. Первая страница на nudnik.ru с кучей текста на ней весит всего около 10 килобайт.

Короче, gzip и хоть какая-то оптимизация страниц — хорошо. Но Ajax зрелищней.

PS. Понятно, что ajax + gzip. Только вот ajax я везде вижу, а gzip — нет.

CSS и борьба со спамом

09.07.2007 14:48
Изящный способ борьбы со спамом веб формах с помощью CSS. Хитрость заключается вот в чем: надо создать фиктивное поле в форме, скрытое с помощью CSS. Человек, пользующийся обычным браузером, это поле не увидит и не заполнит, в отличие от спам-бота, которые в большинстве своем CSS вообще не понимают. А дальше дело техники: серверный скрипт проверяет заполнено ли фиктивное поле и если оно заполнено — дает отлуп. Все просто и изящно, однако если будет применяться массово, то спам-боты научатся таки распознавать CSS и все вернется на круги своя.

Написано вот тут.

Вообще да, любой способ борьбы стоит именно на этом: чем штука массовей, тем больше выгоды ее сломать. Поэтому каждому приходится изобретать свой способ.

Я не так давно придумал менее изящный способ: передавать в поле hidden время (timestamp) генерации страници с формой. А потом сравнивать с текущим временем на сервере.

Понятно, что боты будут постить спам, скорее всего, «слишком быстро», не тратя время на набор текста.

Пока не уверен, как будет работать этот способ, надо проверять.

Смотри также:
Как избавиться от спама в форумах и блогах

Spesta 2.0

01.12.2006 02:52
…а дело его живет.

Spesta 2.0

Версия для печали

29.08.2006 08:54
На одном сайте у статей есть «печатная версия».
Видимо, все остальное по умолчанию — непечатное.

True story.

Что такое Web 2.0

20.08.2006 07:11
Собственно, это — все, что хотелось сказать про web 2.0
Страницы:  3   2   1 

Шторы. Компания "Мастер Декор". шторы фото.