kien iros? или что будет с информацией завтра

2014-02-07

Вынося из разговора с уважаемым сэром baadoo

Сначала — флоппинет и фидонет. Когда все есть у всех на винтах, а глобальная сеть глобальна и хорошо организована, но только на текстовом уровне — относительно большие сетевые библиотеки были еще в фидонетовские времена. Хотя обмен шел в основном действительно в режиме флоппинета (назовем его так — хотя на самом деле все конечно ходили с винтами).

Дальше все определялось сначала ростом емкости информационных накопителей (в том числе — оптических), потом — широтой каналов, потом — появлением Больших Сетевых Хранилищ (примерно начиная с gmail’а), когда стало возможным организовывать в сети большие порталы с данными. От разрозненных, но взаимосвязанных условных страничек перешли к сетевым порталам, а потом к хранилищам мультимедии — как раз к к этому моменту появились djvu-книги, что кмк было одной из «тихих революций» интернета — книг стало действительно много (библиотека «Колхоза» — лучший тому пример). Ну и совершенствование OCR тоже даром не прошло. Где-то на этой стадии начался обратный процесс — наряду с быстрым ростом начало проявляться «трение». Первая причина «трения» — замусоривание сети, точнее поисковиков, рекламой и результатами «поисковой оптимизации». Вторая причина — проснувшееся у «правообладателей» понимание масштабов процесса.

Замусоривание поисковиков, рост технических возможностей и рост аудитории привели к тому, что информация начала собираться в действительно БОЛЬШИЕ порталы — типа флибусты, википедии или местных аудиовидео-локалок. Во-первых, всегда проще искать нужную информацию в одном месте (например, книгу на флибусте), во-вторых работает «эффект пылесоса» (большой портал притягивает к себе большое коммьюнити, что в свою очередь приводит к тому, что он быстро и эффективно пополняется информацией — и эта информация всегда актуальна — я там выше писал, что как только книга появляется в сети — она, с коротким лагом, появляется и на флибусте). Отсюда тенденция (тут я сужу исключительно по себе) вместо глобального поиска держать под рукой несколько проверенных порталов (книги-музыка-видео-новости-справка-словарь), благо поиск по каждому из них легко настраивается в firefox. И это очень здорово — вся информация не просто под рукой, но еще и хотя бы первично систематизирована, упорядочена и не требует затрат для хранения от отдельного пользователя. Что провоцирует винчестерную лень.

Основной недостаток такой системы — это централизация. Отмирают локальные хранилища и странички, теряется распределенность. А это в свою очередь делает систему нескольких больших порталов уязвимой для претензий правообладателей — не нужно охотится за массой распределенных страничек — достаточно закрыть портал. Или перекупить его. И вообще — централизация чревата side effects.

При этом сейчас появилась еще одна действующая сила — распространение платежных систем и возможность онлайн-бизнеса (окончательно — с распространением дешевых читалок с проприетарным программным обеспечением) — поэтому становится коммерчески выгодным закрывать свободные «пиратские» порталы, вытесняя пользователей на платные сервисы.

Я уже довольно давно (в 2004ом, судя по старым заметкам) отследил тенденцию все большей виртуализации «своих» данных. Увеличение каналов, емкостей накопителей и мощностей железа приведет к Большим Сетевым Компьютерам как заместителям персоналок. Собственно, гугл что-то такое уже продвигает в хромобуках. С точки зрения бизнеса это очень выгодно. Не нужно защищать игрушку копирайтом — можно брать с пользователя абонплату за пользование игровым сервером, не нужно защищать софт и данные заведомо взламываемой защитой — можно аналогичным образом продавать это все в аренду. Если у человека вместо персоналки будет только дешевый терминал плюс толстый канал связи к большому серверу — он не сможет хранить у себя контрафакт, он потеряет мобильность и распределенность со всеми вытекающими.

Такой сценарий меня не очень радует — от свободной и интегрированной сети, которая получает бонусы именно от взаимодействия мы возвращаемся к повторению реального мира, но уже в вирутальном воплощении — те же книжные магазины вместо общей библиотеки, вместо общей видеотеки, вместо всеобщего информатория. Собственно, вот тут мы некоторые обсуждали плюсы и минусы. Не говоря уже о том, что большой бизнес скажем так меньше заботится о прогрессе и больше о прибылях. И часто получается так, что интересы бизнеса и коммьюнити развиваются в разных направлениях.

Что можно противопоставить этому, кроме ухода в «сетевое подполье»? Точнее, скажем так, какие пути вижу тут я. Использование свободного софта и свободного контента везде, насколько это возможно. Open Source — означает независимость и неподконтрольность. Open Content — аналогично говорит о незаангажированности и о другой идеологии в отношении контента. И в том и в другом случае свобода подразумевает «сетевой эффект» от использования — примерно такого же, как софт, который выигрывает от свободных стандартов и свободных лицензий.

Главная проблема — низкая упорядоченность свободного контента сейчас. Издатели работают, как фильтр «качество-не качество», а в свободном сообществе сложно построить рейтинговую систему. Но подвижки есть — например, трекерный артсовет. Или скажем Тунгуска.

Еще один (важный) момент — борьба с уже существующими ограничениями копирайта — в частности ограничение произвола правообладателей до разумных пределов — мне очень нравится комплект тезисов lqp — например освобождение всего контента Империи Зла (т.е. книг-фильмов-аудио до 1991 года). Но это тема отдельного разговора.

То есть существенные моменты, если их резюмировать:

  • технический прогресс -> расширение каналов связи, увеличение емкости хранилищ и быстродействия железа -> миграция всего в сеть
  • миграция всего в сеть -> централизация + распространение платежных систем -> бизнес-контроль над большими информационными доменами (собственно, уже)

Бизнес-контроль над большими объемами информации — это плохо по многим причинам. Основная — бизнес-интересы редко совпадают с интересами социума.

Альтернативные пути развития (намеренно не учитываю подполье — типа Тор/i2p/торрентов и так далее):

  • свободный софт и свободный контент
  • приведение в порядок законодательства по авторскому праву (многое в текущей реальности захвачено незаконно — я бы сказал по-рейдерски)
  • альтернативные коммерческие модели развития. например теки Кравецкого
Реклама

Фолдинг Большого Текстового Файла в Vim

2012-11-24

Чем больше эксплуатирую АБТФ и markdown-файлы, тем сильнее убеждаюсь, что главным для работы со структурой (которая маркируется шарпами в начале строки) является простая генерация содержания. У меня есть удобный инструмент в виде Малой Карты, а сегодня обнаружилось тоже удобное и, на удивление, быстрое решение в виде выражения для фолдинга по заголовкам маркдауна. Я его слегка допилил до своего случая — вместо автозагрузки в примере сделал вызов по нажатию ,mf

" быстрый фолдинг для маркдауна
" http://stackoverflow.com/questions/3828606/vim-markdown-folding

function! MarkdownLevel() 
    let h = matchstr(getline(v:lnum), '^#\+') 
    if empty(h) 
        return "=" 
    else 
        return ">" . len(h) 
    endif 
endfunction

function! MarkFold()
    setlocal foldexpr=MarkdownLevel()  
    setlocal foldmethod=expr  
endfunction

nnoremap ,mf :call MarkFold()<CR>

На моем главном файле в почти 7млн символов длиной с полутора тысячью заголовков работает шустро — благодаря тому, что используется fold-expr вместо очень медленного фолдинга по регулярным выражениям. Очень рекомендую.


Лента и Структура

2011-10-17

На вебпланете опубликовали любопытную статью о различии восприятия информации в виде ленты (рсс-лента, френд-лента, твиттер-лента) и простого серфинга. Фейсбучный Timeline по мнению автора — новый шаг в организации информации, сочетающий в себе и ленту и серфинг. Замечу, что у Timeline были предшественники — те же системы управления коллекциями фотографий или музыки могут раскладывать файлы в пространстве по «ключевым параметрам» — дате, времени, модели фотоаппарата, битрейту, жанру музыки и так далее.

Когда я описывал АБТФ, я упомянул, что мой Большой Файл делится на Структуру и Дневник. В Структуре существует своя иерархическая система, если хотите традиционный сайт с линками и всем прочим, Дневник — это в принципе та же лента.

В общем-то при работе с большими объемами информации, процесс ее организации шел примерно теми же шагами — сначала появилась Структура, потом Дневник, сейчас постепенно кристаллизуются скрипты, позволяющие раскладывать Дневник и Структуру по каким-то ключевым параметрам.


ascii-art для vim

2010-11-13

Научился рисовать в виме псевдографикой. Понял, что это будет хорошим подспорьем и ценным навыком. Очень часто хочется оформить данные таблицей или сделать простейший набросок от руки. Я привык иллюстрировать свои записи в бумажной записной книжке небольшими схемами-набросками и в АБТФ этого некоторое время не хватало.

Читать далее…


АБТФ: большая и малая карты

2010-08-02

Прошло достаточно много времени с тех пор, как я писал про Аффигительно Большой Текстовый Файл. Это не значит, что тема стоит на месте — просто на все не хватает времени.

Основные новости следующие:

  1. Я дополнил навигацию по разделам и теперь могу произвольно выделять-вырезать-копировать-удалять отдельные заметки через d]] y[[ v]] и тому подобные комбинации клавиш.
  2. 
    " --------- jumper ------------
    map ]] /^[#@]
    map [[ ?^[#@]
    " --------- jumper ------------
    
    

    Все заголовки у меня начинаются с # в Структуре и с @ в дневниковых заметках. То есть по ]] и [[ можно прыгать от заголовка к заголовку, а скажем по d]] удалить текущую заметку в буфер и вставит ее в каком-нибудь новом месте. Через v]]]]]]d можно скопировать три заметки подряд и так далее. Получилось очень удобно.

  3. Файл подсветки я переписал под «стандартные» цвета, так что теперь могу менять цветовые схемы как заблагорассудится не боясь, что какая-то часть подсветки не попадет по цвету.
  4. И главное. Используя вимаутлайнер, я построил на его базе древовидную систему работы с блогом, которую условно назвал Большой и Малой Картами.

Читать далее…


Метаинформация и теги

2010-05-10

2010-04-27 00:15

Мысль, возникшая после чтения хабровских топиков: надо говорить не о тегах, а о метаинформации, как о более общем понятии семантической сети.

Это проясняет сразу несколько вещей Читать далее…


Каталогизация дискохранилища

2010-03-27

Идея каталогера, который бы сохранял на диске содержимое моей библиотеки (медиатеки? информатеки? дискохранилища?) dvd не отпускала меня с тех самых пор, как я перебрался на убунту. Конечно, Cathy прекрасно работала под wine-ом, и вполне справлялась с теми задачами, которые на нее были возложены еще в старой системе. Некоторое время у меня крутилась в голове идея обобщенного скрипта на Питоне, однако в конце-концов на Хабре появился пост, который расставил все по своим местам. Главной оказалась идея о том, что файловую структуру диска без особых хлопот можно получить через find.

Читать далее…


%d такие блоггеры, как: