sergeyr: (Default)
[personal profile] sergeyr
Появился сервис для поиска в ЖЖ по комментариям:
http://ljsearch.org/
Проверил, вполне прилично работает.

P.S.
"Следи за собой, будь осторожен".
Теперь поиском можно найти всякую неосторожную фигню, которую вы в комментах оставили. И удаление не помогает - ежели оно в кэш поисковика попало, то оттуда уже так просто не удаляется.

(no subject)

Date: 2007-03-20 09:52 (UTC)
From: [identity profile] kica-c-hvostom.livejournal.com
ой, совсем не радует. Начинает напоминать тотальную слежку.

(no subject)

Date: 2007-03-20 09:55 (UTC)
From: [identity profile] sergeyr.livejournal.com
Меня - радует. По моему мнению, за свои слова нужно отвечать.
А вот ежели моё государство попытается это дело использовать против своих граждан - тады да, не понравится. Но это у нас, к счастью, уже невозможно.

(no subject)

Date: 2007-03-20 09:57 (UTC)
From: [identity profile] kica-c-hvostom.livejournal.com
а как это скажется в подзамочных постах и скрытых комментах? очень мне не хочется, чтобы все кто ни попадя вычитывали то, что я могу "на ухо" кому-то шепнуть :(

(no subject)

Date: 2007-03-20 10:05 (UTC)
From: [identity profile] sergeyr.livejournal.com
Подзамочные посты не индексируются поисковиками вообще.
Скрытые комменты не индексируются, если они были скрыты на момент индексации. Если позже - остаются в кэше. (Я так один раз восстановил текст, в котором мне перемывали косточки, а потом удалили или скрыли пост. Меня за шамана в итоге приняли, ага...)
Кроме того, гуглем и другими крупными поисковыми монстрами не индексируются посты и комменты в журналах, в которых выставлена настройка "запретить индексацию". (Анекрупных поисковиков можно не опасаться - у них бабла не хватит за значимым количеством людей следить.)

(no subject)

Date: 2007-03-20 10:38 (UTC)
From: [identity profile] kica-c-hvostom.livejournal.com
блин... все равно стремно. раньше можно было коммент сделать и удалить. Телефоны, адреса, пароли, явки...

(no subject)

Date: 2007-03-20 10:40 (UTC)
From: [identity profile] sergeyr.livejournal.com
Кошка, я ж давно уже писал, что с появлением уведомлений о комментариях этот метод стал ненадёжным.

(no subject)

Date: 2007-03-20 19:45 (UTC)
From: [identity profile] http://users.livejournal.com/_glav_/
как там: "это интернет.." ;)
а если серьёзно, то передавать приватную информацию через публичные средства нехорошо. если уж так стрёмно - почту хотя бы надо использовать..

(no subject)

Date: 2007-03-20 09:57 (UTC)
From: [identity profile] gigienishvili.livejournal.com
а как им пользоваться?

(no subject)

Date: 2007-03-20 10:00 (UTC)
From: [identity profile] sergeyr.livejournal.com
Да как и любым поисковиком - ввести что нужно найти и кликнуть на кнопочку. Я вот поискал все упоминания себя любимого - он мне выдал 1200 с чем-то постов, где я упоминаюсь в самом тексте, либо участвовал или упоминался в комментах.

(no subject)

Date: 2007-03-20 10:04 (UTC)
From: [identity profile] gigienishvili.livejournal.com
Выдает в каком то непонятном порядке... Да и каментов вроде нет, только посты да упоминания в постах.

(no subject)

Date: 2007-03-20 10:09 (UTC)
From: [identity profile] sergeyr.livejournal.com
Мне каменты выдавал в больших количествах. Он, правда, выдаёт ссылку не на сами комментарии, а на посты, в которых эти комментарии были (иначе можно задолбаться).
Полагаю что настройку сортировки подключат позже, сервис только появился.

(no subject)

Date: 2007-03-21 07:12 (UTC)
From: [identity profile] shikaree.livejournal.com
Сервис выдает ссылки в том порядке, в каком их сортирует базовый поиск гугла (не по блогам), так как поисковик основан на технологии Google CSE. Соответственно и в результатах поиска пост или коммент будет выдан только после того, как его основной поиск гугла проиндексирует.
Настройку сортировки сделать практически невозможно, так как гугл своим яваскриптом результаты отдает.
Это я его делал. Вот еще на той же технологии - поисковая система для веб-разработчиков (http://codavr.ru/)

(no subject)

Date: 2007-03-21 07:17 (UTC)
From: [identity profile] sergeyr.livejournal.com
Понятно, спасибо.

(no subject)

Date: 2007-03-20 10:01 (UTC)
From: [identity profile] sergeyr.livejournal.com
А, ещё он ищет по профилям.

(no subject)

Date: 2007-03-20 10:59 (UTC)
From: [identity profile] breqwas.livejournal.com
Оно на базе гугля, и по-настоящему хорошо работать не может. Ну не все комменты он индексирует, не все.

Впрочем, про "будь осторожен" - верно.

(no subject)

Date: 2007-03-20 11:01 (UTC)
From: [identity profile] sergeyr.livejournal.com
Что, яндекс лучше? B-}

(no subject)

Date: 2007-03-20 11:02 (UTC)
From: [identity profile] breqwas.livejournal.com
Не лучше. Пока хорошо индексировать комментарии невозможно в принципе.

(no subject)

Date: 2007-03-20 11:04 (UTC)
From: [identity profile] sergeyr.livejournal.com
Именно. Що маємо, те маємо.

(no subject)

Date: 2007-03-20 12:08 (UTC)
From: [identity profile] gnuzzz.livejournal.com
В качестве поисковика по постам - однозначно лучше

(no subject)

Date: 2007-03-20 12:17 (UTC)
From: [identity profile] sergeyr.livejournal.com
Я тестировал яндексовый, гуглевый и lj-seek. Результат оказался в порядке возрастания лучшести.

(no subject)

Date: 2007-03-20 12:27 (UTC)
From: [identity profile] gnuzzz.livejournal.com
ну, ljsearch.org у меня в эксплорере вообще не работает, только в файрфоксе.
а по поводу возрастания лучшести:
http://blogs.yandex.ru/search.xml?text=%CF%EE%FF%E2%E8%EB%F1%FF+%F1%E5%F0%E2%E8%F1+%E4%EB%FF+%EF%EE%E8%F1%EA%E0+%E2+%C6%C6+%EF%EE+%EA%EE%EC%EC%E5%ED%F2%E0%F0%E8%FF%EC%3A

http://ljsearch.org/search?q=%D0%9F%D0%BE%D1%8F%D0%B2%D0%B8%D0%BB%D1%81%D1%8F+%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81+%D0%B4%D0%BB%D1%8F+%D0%BF%D0%BE%D0%B8%D1%81%D0%BA%D0%B0+%D0%B2+%D0%96%D0%96+%D0%BF%D0%BE+%D0%BA%D0%BE%D0%BC%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%80%D0%B8%D1%8F%D0%BC%3A&sa=Search&cx=006852972690819342849%3Ag0jc8vpypnm&cof=FORID%3A9&client=google-coop-np#1058

ЗЫ: а что такое lj-seek?

(no subject)

Date: 2007-03-20 12:38 (UTC)
From: [identity profile] sergeyr.livejournal.com
Ты кавычки забыл поставить, вот яндекс и выдал хвост мусора по словоформам. Это не достоинство, это скорее недостаток.

LJ-seek - это http://www.ljseek.com

(no subject)

Date: 2007-03-20 13:29 (UTC)
From: [identity profile] gnuzzz.livejournal.com
Главное, что яндекс находит нужный пост, и ставит его первым номером в списке результатов.
А если кавычки поставить, то кроме яндекса вообще никто ничего не находит;)
Это я к тому, что яндекс намного оперативнее обновляет базу.
Ну и расширенный поиск у него больше возможностей дает. Хотя ищет только по русскоязычным блогам/форумам - это, конечно, минус

(no subject)

Date: 2007-03-20 13:37 (UTC)
From: [identity profile] sergeyr.livejournal.com
> Главное, что яндекс находит нужный пост, и ставит его первым номером в списке результатов.

А, так ты вообще молотком гайки закручиваешь. Этот сервия на комменты ориентирован, а для поска по постам гугл давно сделал вот это:
http://www.google.com/blogsearch?hl=en&num=100&c2coff=1&lr=&ie=UTF-8&scoring=d&q=%D0%9F%D0%BE%D1%8F%D0%B2%D0%B8%D0%BB%D1%81%D1%8F+%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81+%D0%B4%D0%BB%D1%8F+%D0%BF%D0%BE%D0%B8%D1%81%D0%BA%D0%B0+%D0%B2+%D0%96%D0%96+%D0%BF%D0%BE+%D0%BA%D0%BE%D0%BC%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%80%D0%B8%D1%8F%D0%BC%3A

Оперативность я не проверял в точности, но по-моему они оба обновляют порядка раза в сутки, только в разное время - поэтому возникает ощущение разницы частоты.

(no subject)

Date: 2007-03-20 14:43 (UTC)
From: [identity profile] gnuzzz.livejournal.com
я с самого начала и написал - "в качестве поисковика по постам";)
Поиск от гугла буду посмотреть, thanks
Обновляют и яндексблоги, и (насколько вижу) гугльблогсеарч значительно чаще раза в сутки - например, оба находят вот этот пост http://ivanov-petrov.livejournal.com/612786.html ~получасовой давности

(no subject)

Date: 2007-03-20 14:46 (UTC)
From: [identity profile] sergeyr.livejournal.com
Извини, вовремя не заметил оффтопика.
Возможно и чаще. Я не интересовался движками поисковиков и весьма смутно представляю себе их работу, и исходил из того, что посты, за которыми я слежу регулярно, как правило появляются там на следующий день.

(no subject)

Date: 2007-03-20 11:47 (UTC)
From: [identity profile] u-uka.livejournal.com
Я опять пришло нудеть... Неадресно.
Люди, а люди. Неуж и вправду существуют вменяемые, взрослые люди любого пола, которые могут относиться к информации, вывешиваемой _в свободный доступ_ - как к "шепнуть на ушко". Ну это ж сеть, е-мое.
Я правда не понимаю. И это уже начинает печалить :(

(no subject)

Date: 2007-03-20 11:49 (UTC)
From: [identity profile] sergeyr.livejournal.com
Так єто не вполне свободный доступ. На подзамочные записи, например, может посмотреть только авторизировнный пользователь из выбранного тобой списка.

(no subject)

Date: 2007-03-20 12:00 (UTC)
From: [identity profile] u-uka.livejournal.com
Так они же и не индексируются.
Я как раз о том, что индексация комментов, висящих в свободном доступе, вызывает реакцию "следи за собой".

(no subject)

Date: 2007-03-20 12:15 (UTC)
From: [identity profile] sergeyr.livejournal.com
А в открытом доступе раньше можно было расчитывать на эффект толпы. Большинство людей вполне обоснованно считает, что конфиденциальные вопросы вполне можно обсуждать в толпе, т.к. их слышат только случайные люди, и вероятность того, что это дойдёт до кого-то, кто может этой информацией воспользоваться против тебя - так же ничтожна, как вероятность взлома квартиры и обыска в ней / взлома ЖЖ.
Теоретически эту проскочившую в толпе информацию всегда можно выцепить, злоумышленник сталкивается при этом с той же проблемой поиска. В тучах комментов, да ещё в свёрнутых из-за размера тредах, поиск раньше немногим проще, а в особых случаях комменты ещё и скрывались, что делало целенаправленный поск "в толпе" вообще безнадёжным.
С появлением этой поисковой службы этот поиск стал вполне реализуем.

(no subject)

Date: 2007-03-20 14:29 (UTC)
From: [identity profile] bala-lajka.livejournal.com
милая вещица!

Profile

sergeyr: (Default)
sergeyr

Style Credit

Powered by Dreamwidth Studios

Expand Cut Tags

No cut tags