Tags: практика

Рассказы об анализе: терминологический аппарат

15:06 15.04.2014
Рассказы об анализе: терминологический аппарат
Если в научной работе (аналитической) дается новое определение известного термина - это не означает, что автор претендует на лавры. С таким же успехом это может означать, что существующие определения в недостаточной степени или не с нужных сторон характеризуют предмет.

Приведу пример из реальной научно-исследовательской работы "Анализ информационной деятельности территориальных органов МЧС России". В ходе этой работы проводился анализ качественных данных (содержания) большого числа нормативных документов. В этих документах постоянно встречались термины "социальные медиа", "социальные сети", "блоги", "блог-площадки" и т. д., причем нигде не давалось определений того, что под этими терминами понимается, некоторые из них выступали, как взаимозаменяемые без какого-либо на то основания. Пришлось разбираться.

Блог, согласно расхожему определению, – интернет-журнал событий, интернет-дневник, онлайн-дневник. Однако для целей ведения системной деятельности в рамках организации такое определение недостаточно. В нашем случае блог разумнее определить как относительно регулярный по интенсивности, предметной области, авторству и характеру связи с соответствующей организацией поток мультимедийного контента и библиотека (архив) этого контента, доступ к которым является свободным и всеобщим и предоставляется посредством интернет-технологий.

Иными словами, "интернет-дневник" об организации может вестись ее сотрудником или сторонним лицом (второе характерно для известных компаний и организаций), публикации выкладываются относительно регулярно (несколько раз в день +/- несколько публикаций, раз в неделю +/- несколько дней и т. д.), содержание сконцентрировано на деятельности организации (могут присутствовать публикации на смежные темы), доступ на чтение имеют все (если речь не идет о внутреннем "блоге" в рамках интрасети, хотя в этом случае он ближе к корпоративной почте), причем для изучения доступны все когда-либо опубликованные материалы, кроме специально удаленных или закрытых.

По аналогии, социальная сеть часто определяется, как платформа, онлайн-сервис или веб-сайт, предназначенные для построения, отражения и организации социальных взаимоотношений. Мы и здесь дадим другое определение. Социальная сеть – это совокупность полной и частичной контактной и другой информации, связанной с людьми, организациями и другими сущностями (брендами, общественными объединениями, политическими партиями и т. д.), а также, возможно, информация о связях между ними, которые находятся в распоряжении субъекта и могут быть использованы в его интересах. При этом:
  • под субъектом может пониматься разработчик социального сервиса, особа, получившая указанные данные через открытые интерфейсы сервиса, управляющий call-центра или центра опроса общественного мнения, человек, коллекционирующий визитные карточки и т. д. (способ получения информации неважен - важен ее характер);
  • интересы субъекта могу включать расширение социальной сети с целью профессионального развития, адресное предоставление информации, личное общение и т. д.;
  • связи в сети могут иметь как конкретный характер ("женат на"), так и общий ("коллеги", "друзья");
  • как правило, предполагается возможность описания социальной сети в некотором формальном виде, в бумажной или цифровой форме;
  • доступ к таким данным может быть полным или частичным, всеобщим или ограниченным, в зависимости от преференций субъекта (обладателя) и объекта контактных и других данных (того, чьими они являются).
Термин "социальная сеть" был некорректно адаптирован в русском языке в качестве собирательного обозначения сайтов, типа Facebook и Одноклассники. Настоящая социальная сеть – это теоретическая конструкция, состоящая из агентов и связей между ними. Понятие возникло в рамках развития теории малых групп, антропологии и биологии независимо в 60-х годах прошлого века. В английском языке Facebook, Twitter, MySpace и т. д. – это "онлайн социальные сервисы" или "сервисы социального взаимодействия" (англ. "Social networking service"), и это более корректные термины.

Сервис или веб-служба, веб-сервис (англ. "web service") — идентифицируемая веб-адресом программная система со стандартизированными интерфейсами (здесь соглашусь с Википедией). Как правило, имеет четкое и ограниченное назначение, может использоваться как непосредственно из браузеров, так и через открытые программные интерфейсы другими приложениями.

Блог-площадка – веб-сервис, позволяющий размещать блоги и управлять ими.

Социальный сервис или онлайн социальный сервис – веб-сервис, предоставляющий различные возможности по управлению социальными сетями и одновременно выступающий в качестве блог-площадки. В зависимости от реализации конкретный набор возможностей может быть различен: в LiveJournal менее выражена социальная составляющая, а в LinkedIn – блог-составляющая. Facebook, Twitter, ВКонтакте, Одноклассники и даже YouTube – это социальные сервисы (последний можно отнести к сервису видео-хостинга, но, на самом деле, он имеет все составляющие социального сервиса: профили, подписки и т. д.). Социальные сети разных пользователей пересекаются, в рамках сервиса действует унифицированная форма представления сетей, как правило, имеется открытый программный интерфейс (разной степени открытости) для извлечения из социального сервиса информации (с различными, меняющимися от сервиса к сервису ограничениями: в частности, социальный сервис LinkedIn устанавливает ограничения на характер информации о связях, которую можно извлечь посредством открытого интерфейса, причем ограничения носят как юридический, так и технический характер).

Социальные медиа – в описании на Википедии дается классификация, с которой я склонен согласиться с определенными оговорками. Социальные медиа - вид массовой коммуникации, обобщенное название с точки зрения содержания информации, размещаемой пользователями:
  • для социальных сервисов;
  • блогов и микроблогов;
  • форумов;
  • сайтов отзывов (хотя, по сути, это те же форумы, где пользователь дополнительно может дать оценку интересующему товару / услуге, но он может дать эту оценку и без комментария);
  • фото и видеохостингов;
  • сайтов знакомств;
  • геосоциальных сервисов (предоставляющих пользователям "отметиться" в том или ином месте на карте, заведении и т. д.).
Почему важно уточнить приведенные выше понятия? На это есть несколько причин:
  1. Таким образом формируется представление о двух видах деятельности организации в Интернете: работ по созданию, публикации, продвижению контента, поисковой оптимизации, опросам общественного мнения и т. д. – с одной стороны, и работ по развитию социальной сети – с другой, и только совокупная системная работа по обоим направлениям может давать ожидаемые и позитивные плоды в рамках информационной деятельности.
  2. Это позволяет выполнить декомпозицию задачи информационной деятельности в Интернете, поскольку указанные области пересекаются, взаимодействуют, но не совпадают, в них применяются разные методы из разных областей науки, разные критерии оценки эффективности.
  3. Помимо прочего, расхожие определения отражают взгляд на определяемые феномены, системы с точки зрения пользователей - авторов публикаций, поставщиков информации, читателей, либо сервисов. Данные же мною определения отражают парадигму анализа данных - это взгляд человека, который должен извлекать информацию и подвергать ее анализу.
В нормативных документах, посвященных информационной деятельности МЧС, встречается еще несколько терминов без определения, в частности "топовые блоггеры", но, к сожалению, ни тогда, ни сейчас я не могу их определить – это вопросы, которые могут стать темой дальнейшего исследования, поскольку здесь требуются специфические методики оценки "топовости" в зависимости от целей использования "блоггеров", которые еще тоже предстоит уточнить.

Я снял несколько видео, где рассказываю про указанную научно-исследовательскую работу, так что, если будет интерес, милости прошу. :)

read more at АйТи-общественный блог

Рассказы об анализе: Почему? Открытие второе

11:55 10.06.2013
Рассказы об анализе: Почему? Открытие второе
Это уже из области практики. Недавно разрабатывали методику прогнозирования синергетических чрезвычайных ситуаций. Смысл задачи таков: существует объект, на котором могут происходить различные аварии, приводящие к ущербу. Сценарии возможных аварий определены и зафиксированы в декларации безопасности объекта, вместе с такими параметрами, как вероятность возникновения инициирующих событий (брешь в резервуаре, наличие источника возгорания и т. д.) и ущерб, определенный по моделям, соответствующим характеру аварии (разлив вещества, пожар, взрыв и т. д.). Также известно, какие неблагоприятные природные явления могут возникать в данной местности и как часто (аномальный холод или жара наводнение, землетрясение и т. п.). Проблема в том, что в нынешнем виде вся эта информация существует по отдельности, а это неправильно – нужно учитывать взаимодействие всех факторов.

Кратко изложу свой подход к решению задачи. Возьмем, к примеру, аномальную жару. Она, очевидно, может повлиять на давление в резервуаре с веществом, как следствие, на вероятность трещины в резервуаре и вероятность аварии. Но это еще не все: та же аномальная жара вполне может повлиять на радиус зоны распространения физических параметров аварии, мощность взрыва, скорость испарения ядовитых веществ. Кроме того, необходимо учитывать и эффект домино или каскадный эффект: одна авария может привести к другой, та к третьей и так далее. Иными словами, если происходит первая авария, нужно понимать, куда бежать, а бежать нужно не только к уже взорвавшемуся агрегату, чтобы ее ликвидировать, но, возможно, и к тому агрегату, который, согласно расчетам, имеет наибольшую вероятность взорваться третьим в цепочке и/или нанести при взрыве максимальный ущерб. Почему третьим, а не вторым? Потому что возможно, что второй агрегат имеет настолько большую вероятность взорваться после взрыва первого, что находиться рядом с ним опасно, или, наоборот, он имеет настолько ничтожную с точки зрения ущерба зону распространения физических параметров даже с учетом внешних природных и техногенных факторов, что о нем не стоит беспокоиться, сосредоточив усилия на агрегатах 1 и 3. Я предлагал строить модель в виде деревьев всех возможных цепочек аварий, иными словами, я предлагал использовать деревья событий, где каждый узел – это авария, и пересчитывать параметры (вероятности аварии и параметров распространения) с учетом всего пути, пройденного из корня, то есть от первой, начальной аварии до данной.

Подход был отвергнут коллегами на основании того, что при его реализации возникает «комбинаторный взрыв», то есть объем необходимых расчетов растет взрывным образом с увеличением количества возможных сценариев аварий. Скажем, в декларации безопасности объекта зафиксировано n возможных сценариев аварий, тогда количество всех возможных цепочек будет равно количеству перестановок из n элементов. При 5-ти возможных аварийных сценариях, нам нужно будет работать со 120 цепочками и 325 узлами, что не так плохо, но уже при 10-ти возможных сценариях мы имеем 3 628 800 цепочек и 9 864 100 узлов. Это и правда мощно! В одной из рассмотренных деклараций безопасности число аварийных сценариев превышало несколько сотен, со всеми вытекающими цифрами.


Ключевой момент здесь не в самом отказе коллег от подхода, а в причине этого отказа. Разумеется, в ходе решения возникает комбинаторный взрыв: чтобы понять, как ситуация будет развиваться на следующем шаге, нам необходимо оценить ее на данный момент, а она зависит от всего, что уже нагрелось, разорвалось, вытекло или горит, то есть мы вынуждены «потрогать» каждую аварию на каждом шаге. Это метод полного перебора, он предлагался мною в качестве основы, а не в качестве готового решения. Разумеется, необходимо ограничивать перебор: ввести эвристики, применить принцип разумных предположений, распространить ограничения. Например, мы можем с уверенностью сказать, что если на агрегате уже произошло возгорание, то на нем уже не может возникнуть авария по другому сценарию, который предусматривает отсутствие возгорания. Мы можем считать, что на одном агрегате происходит только одна авария. Мы можем ограничить рассмотрение 2-мя или 3-мя авариями в цепочке (уровнями в деревьях) и углубляться в деревья по мере необходимости и развития ситуации. Было, куда стремиться, нужно было только подобрать методы сокращения необходимых вычислений и требуемой памяти, в наибольшей степени отвечающие целям защиты людей и имущества. Но подход был отвергнут только из-за порождаемого комбинаторного взрыва.

На сайте JSMapReduce есть простой пример того, как из небольшого набора исходных данных – 52 карт – порождается гигантский массив для обработки – 2 598 960 комбинаций из 5 карт, которые могут достаться игроку в покер. Эта цифра получается, как количество сочетаний из n элементов по k элементов без учета различных положений элементов.

Теперь представим себе, что игроков 4-ро, 5-ро или больше, и попробуем подсчитать количество всех комбинаций карт, одновременно находящихся у всех игроков (и в этом случае будет еще важно, у кого именно какие конкретные карты). Попробуем сделать то же для случая, когда несколько человек играют в «Очко», и карты раздаются из смеси 2-ух, 3-ех, 4-ех колод. Иногда большой объем данных и вычислений неизбежен (пока для данной задачи не найден алгоритм получше, если он вообще может быть найден), но, в принципе, для решения многих задач, где возникает комбинаторный взрыв, у нас на сегодняшний день есть и мощности, и алгоритмы.

Размышляя над этим, я сделал второе открытие: ученые могут не знать о современных возможностях технологий, и это само по себе нехорошо, но, что намного хуже, находясь в тенетах своего незнания, они могут делать ошибочные выводы о нецелесообразности тех или иных масштабных расчетов, невозможности применения тех или иных методов, недостижимости приемлемой точности вычислений.

Причем здесь анализ данных? Все, опять-таки, очень просто: он зачастую связан с технологиями ничуть не меньше, чем с наукой. Деревья структуры, метод главных компонент, вычисление метрик и визуализация больших наборов данных руками не делаются, а потому требуют от аналитика «быть в теме» технологий, которые меняются куда быстрее фундаментальной науки. Иными словами, чтобы испечь пирог под названием «Результаты анализа», нужно замесить тесто из фундаментальной и прикладной науки, а также технологий, причем это касается и навыков работы с оными, а не только общих положений, и приправить все это солидной щепоткой интуиции. Методы добывания и обработки больших данных, MapReduce, программы построения статистических и других моделей, программы визуализации – это только на сегодняшний день, и это далеко не все.

read more at АйТи-общественный блог

Рассказы об анализе: Почему? Открытие первое

11:33 09.06.2013
Рассказы об анализе: Почему? Открытие первое
Почему я вообще взялся за эту область? Во-первых, у меня случился пару лет назад ренессанс лирических отношений с математикой и программированием, причиной которому послужило как раз открытие мною анализа данных. Для меня это было что-то совершенно новое: новый взгляд на казалось бы известные вещи, новые цели, комбинации методов, и наука, и не совсем наука. В общем, мне интересно этим заниматься и интересно об этом рассказывать. Кроме того, эта первая причина послужила толчком к парочке открытий, которые стали, соответственно, второй и третьей причинами.

За 11 лет работы в высшей школе мне часто приходилось слышать от студентов (математиков и математиков-программистов), что их учат непонятно чему, чему бы в тот момент их ни учили, да и когда я сам был студентом, меня посещали те же мысли. И вот, спустя годы, начав заниматься регрессионными моделями, кластеризацией и прочими штуками, я стал периодически ощущать дежавю. Кластеризация, метод ближнего/дальнего соседа? – Где-то это было. Проверка гипотез? – Да, у меня был «трояк» по математической статистике, но я что-то такое помню. Средний кратчайший путь в социальном графе? – Да, да, да… И в какой-то момент меня осенило: не то, чтобы учили не тому – учат не так!

Я как-то, еще на первом курсе спросил своего преподавателя по математическому анализу Михаила Семёновича Кильдюшова (дай ему Бог здоровья и долгих лет жизни) о правильной методике преподавания с его точки зрения. Он ответил:

Мне кажется, нужно идти от частного у общему и от общего снова к частному.

Я себе это представляю так:
  1. Рассматриваем задачку, которую непонятно как решать, после чего решаем ее с помощью некоторого метода.
  2. Подробно рассматриваем сам метод, чем расширяем границы его применимости.
  3. Рассматриваем другие задачки, которые можно решать с его помощью.
Я когда-то взял за правило держать дома книги по всем областям математики и по всем технологиям, с которыми я работаю или может быть буду работать (в части технологий это была не самая умная моя идея: они устаревают). У меня есть книги по математическому, комплексному и функциональному анализу, топологии, методам оптимизации, квантовым полям и пр. и др., и, что интересно, только одна из них по характеру изложения полностью соответствует описанному выше принципу, остальные даже близко не приближаются.

Все или почти все книги по разделам математики (и, думаю, не только по ним), принадлежащие перу отечественных авторов, которые мне доводилось видеть (а это порядочно), написаны так, что их невозможно применять на практике. Они написаны фундаментальными математиками для фундаментальных математиков. Чтобы понять математическую статистику по такому труду, сначала нужно изучить том по теории вероятностей, а до него – пару томов по линейной алгебре и математическому анализу. Зачастую отсутствуют примеры практических задач. Недавно начал читать книжку по нечетким множествам. Прочитал 70 страниц, встретил один глупый пример про пирожок с нечеткой стоимостью, да и тот не был рассмотрен до конца, я уж молчу про его практическую ценность. Прочитал всю книгу, долго плевался от явных ошибок в формулах (стр. 9, первая страница основного содержания:

какое из двух высказываний «x не принадлежит A» или «x не принадлежит A» , является истинным, а какое ложным

(привет издательству «Питер»). В очередной раз убедился, что неопределенность можно формализовать, но так и не понял, что на практике со всем этим делать, когда применять, и что можно получить в результате (привет учебно-методическому объединению по «Прикладной информатике» на базе родного МЭСИ, которое рекомендовало эту книгу студентам, обеспечив гриф Министерства образования). А, между прочим, мне через неделю обрабатывать кучу анкет, где встречаются вопросы с открытым ответом. И что я должен делать?

Возможно, я выбираю не те книги, но это не отменяет того факта, что учили и меня, и моих студентов именно по ним! В итоге, чтобы применить что-то из изложенного таким образом на практике, я сначала должен держать в голову кучу голой, ни к чему не привязанной теории, а потом еще изогнуть мозг таким образом, чтобы решить с ее помощью что-то, при полном отсутствии практического опыта.

Это был один полюс. Второй полюс – это «книги рецептов», где рассматриваются исключительно практические примеры. Если книгам первого типа не хватает реализации пунктов 1 и 3 из рассмотренного выше подхода, то книгам второго типа не достает содержания по пункту 2 – описания метода. В результате, если твоя задачка слегка или даже сильно похожа на рассматриваемую в таком «кулинарном справочнике», это еще отнюдь не гарантирует, что ты с его помощью свою задачку сможешь решить: нюансы, которыми твоя задача отличается от примера, могут быть критичными для используемого в книге метода, нивелирующими возможность или обоснованность его применения.

Истина, как обычно, лежит где-то посередине, между этими двумя полюсами, и там очень мало российских математических книг. Зато, что интересно, там очень много книг по программированию. Правда, лучшие и наиболее известные книги по программированию они, как бы, традиционно не отечественные (прошу прощения у российских авторов), как и соответствующие технологии. Зато разница в методологии изложения и результат обучения по фундаментальным математическим и программистским книгам лично для меня очевидны: сложный математический метод, применение которого представлено в виде программы на императивном языке программирования я способен понять, если не «влёт», то за конечное время, а вот если он расписан формулами… В общем, в последнее время и по математике я предпочитаю книги от зарубежных авторов.

Причем здесь анализ данных? Все очень просто: суть анализа данных в получении результата, но необходимость количественно оценивать свою уверенность в этом результате дополнительно требует и определенной теоретической подготовки (например, нужно понимать, корректировать ли результаты множественной проверки гипотез или нет, чем различаются разные варианты такой коррекции). То есть в рамках анализа данных мы совмещаем теорию и практику, причем это может быть теория откуда угодно и практика откуда угодно, и мы берем от теории все необходимое, но только необходимое, которое мы можем получить, опять-таки, откуда угодно (из фундаментальной, практической книги, из Интернета и т. д.). К примеру, один из методов фильтрации данных заключается в применении преобразования Фурье с последующей фильтрацией данных в их частотном представлении и обратным преобразованием. Этот метод появился давно и призван был решать проблемы, связанные с радарами и сонарами. Мы можем применять его к другим данным, не задумываясь о радарах, доказательствах теорем и физике волн, но должны представлять себе границы применимости метода. Итого, в анализе данных мы берем отовсюду столько, сколько нужно, но не больше – этим он мне и нравится, мне кажется, что он представляет собой выход из «фундаментального тупика», в котором оказываются многие люди, которые 5 лет учили математику, а теперь не могут решить ни одной практической задачи за границами 4-ех действий арифметики.

read more at АйТи-общественный блог

Регистрация программы для ЭВМ или базы данных - 2

23:03 10.10.2011
Регистрация программы для ЭВМ или базы данных - 2
Ну вот, первое в моей жизни "Свидетельство о регистрации программы для ЭВМ" получено. Жду еще одно.


Получение, как и подача заявки прошло очень быстро - без очередей, без потери времени. Подъехал, зашел в одно из зданий Роспатента (там же на Бережковской набережной), позвонил. Через 5 минут спустилась девушка, проверила документы, соответствие ФИО указанным в доверенности (здесь правообладатель - ВНИИ ГОЧС МЧС России, а я - его представитель по доверенности на общение с Роспатентом), отдала бумагу. Здание, в которое нужно зайти, не то же самое, где я подавал документы. Нужно здание, где библиотека, но я не могу точно сказать номер дома - не запомнил, поскольку шел с "проводником".

Что для меня остается до сих пор загадкой, так это можно ли с этой бумаги сделать номариально-заверенную копию? Дело в том, что признаками документа являются номер, дата выдачи и чернильная печать, а на свидетельстве только печать тисненая на золоте. В одной конторе мне сделать заверенную копию отказались. Сейчас выясняю, возможно ли это в принципе.



read more at АйТи-общественный блог

Регистрация программы для ЭВМ или базы данных

14:11 28.08.2011
Регистрация программы для ЭВМ или базы данных
Недавно столкнулся с необходимостью сабж и, поскольку разыскивал формы документов в разных местах, а некоторые сочинял самолично, решил сделать этот пост - себе на память, другим на радость.

Для начала несколько общих замечаний:
  • Под программой в данном случае подразумевается то, что имеет исходный текст. Если вы написали калькулятор на C++, то это - программа. Если вы разработали веб-сайт на PhP - это программа. А вот если вы создали в MS Access несколько таблиц и хитрые формы с событиями и специфическими расчетами, то это... это тоже программа! "База данных" в данном случае - это именно данные, которые забиваются в таблицы, более правильно было бы назвать их "массивом данных", но я не придираюсь.
  • Предельный срок регистрации - 2 месяца. Это максимальное время, которое, при нормальном стечении обстоятельств может пройти между подачей заявки и получением сертификата. Есть какой-то официальный тариф для ускорения, но я им не пользовался.
  • Название программы во всех документах должно быть написано одинаково, включая кавычки. Если в одном документе написано:
    Программа для расчета численности сусликов в казахских степях,
    а в другом -
    "Программа для расчета численности сусликов в казахских степях",
    то это может быть сочтено серьезным расхождением, и заявку придется переделывать (или исправлять на месте, что я и делал... у меня программа, конечно не так называлась).
  • Регистрируемые материалы не должны содержать сведений, составляющих государственную тайну. Если правообладателем является какое-нибудь учреждение с намеком на доступ к ней (как в моем случае ФГБУ ВНИИ ГОЧС МЧС России), то у специалистов, обрабатывающих заявку, могут возникнуть вопросы. С другой стороны, ответственность за содержание регистрируемых материалов несет подающий заявку, и на этом основании возникшие вопросы можно "отбить" сразу по телефону.
  • Образцы документов должны быть на сайте Госуслуг, но они там есть далеко не все. Далеко не все они есть и на сайте самого Федерального института промышленной собственности (ФИПС-а). Я буду давать ссылки там, где это возможно.
  • В основном я рассматриваю свой вариант регистрации: правообладатель - государственное учреждение, автор - я. Тем не менее, я буду указывать отличия для случая, когда и автор, и правообладатель - физические лица.
  • Все документы печатаются черным на листах формата A4, с полями по 20 мм (верхнее, нижнее и правое) и 25 мм (левое). В заявлении поля менять не нужно.
  • У меня нет собственного FTP или чего-то подобного, так что я не смог быстро придумать способ, как выложить готовый заполненный комплект документов, чтобы мне не приходилось их периодически проверять. Могу по почте переслать, если у кого-то в том возникнет нужда. Тоже касается и вопросов, если они возникнут - в меру сил постараюсь ответить.
Заявка состоит из нескольких документов:
  • 1. Заявление.
  • 2. Реферат.
  • 3. Исходный текст.
  • 4. Документ, подтверждающий оплату пошлины.
  • 5. Сопроводительное письмо.
Если правообладателем является юридическое лицо, то также необходима
  • 6. Доверенность от руководителя юрлица подателю заявки на общение с ФИПС.
Также опционально могут быть представлены и другие документы, например:
  • 7. Скриншоты.
  • 8. Документ, подтверждающий оплату тарифа для ускорения регистрации.
Пройдемся по очереди по всем документам.

1. Заявление

Бланк можно скачать по следующим адресам:
Сайт ФИПС-а: лицевая сторона, оборотная сторона.
Сайт Госуслуг: бланк целиком.

Графы выше слов "В ФЕДЕРАЛЬНЫЙ ОРГАН ИСПОЛНИТЕЛЬНОЙ ВЛАСТИ" заполняются ФИПС-ом.

В разделе "1. ПРАВООБЛАДАТЕЛЬ (ЗАЯВИТЕЛЬ)" указывается полное наименование юридического лица в соответствии с уставом или ФИО физического лица (причем именно в последовательности Ф, потом И, потом О).

Подраздел "Указанное лицо является" заполняется только в том случае, если есть, что отмечать и вписывать. В противном случае он остается пустым.

В раздел "8. СВЕДЕНИЯ О ПРОИЗВЕДЕНИЯХ, ЯВЛЯЮЩИХСЯ ОБЪЕКТАМИ АВТОРСКОГО ПРАВА" я включил MS Windows с регистрационным номером и MS Visual C# Express также с номером.

Раздел "9А. СВЕДЕНИЯ ОБ АВТОРЕ" заполняется только в том случае, если автор один. Если авторов несколько, то необходимо дополнительно заполнить форму РП/Доп, которую можно скачать по следующим адресам:
Сайт ФИПС-а: лицевая сторона, оборотная сторона.
Сайт Госуслуг: бланк целиком.

В разделе "ПОДПИСЬ(И) ЗАЯВИТЕЛЯ(ЕЙ) ИЛИ ЕГО(ИХ) ПРЕДСТАВИТЕЛЯ" для случая юридического лица приводится подпись руководителя организации или другого уполномоченного лица с расшифровкой должности и ФИО. В идеале, желательно также приложить приказ или иной документ о назначении данного лица руководителем данной организации, а для случая, когда подписывает не сам руководитель, а, скажем, его заместитель - еще и приказ или доверенность на этого заместителя. Документ также скрепляется печатью организации. В случае с физическим лицом достаточно его подписи с расшифровкой ФИО.

Если моих разъяснений недостаточно, то много полезного в сжатой форме практически по каждой графе можно почерпнуть по следующему адресу.

2. Реферат

В реферате должны быть отражены следующие сведения:
  • автор или авторы;
  • правообладатель;
  • название программы;
  • аннотация (что программа делает, для чего предназначена - не более 700 знаков, я считал с пробелами);
  • тип ЭВМ (я по старинке указал "IBM PC AT");
  • язык (я указал "C# (C Sharp)");
  • ОС (в моем случае "Microsoft Windows Vista, Microsoft Windows 7");
  • объем программы (то есть исходного текста - у меня было "76,8 Kб").
Все помещается на одной страничке.


Текст реферата печатается через 1,5 интервала с высотой заглавных букв не менее 2,1 мм (12-ый стандартный размер шрифта Times New Roman вполне годится). Реферат никаким образом не дырявится, не подписывается, на нем не должно быть никаких печатей. Реферат предоставляется в двух экземплярах.

3. Исходный текст

Исходники печатаются отдельным документом. Сначала идет титул с указанием названия программы, правообладателя и автора (титул не нумеруется, но учитывается при нумерации, как обычно), затем нумерованные листы с самой распечаткой. Листов с распечаткой не должно быть более 70 (если полный текст больше, значит нужно выбрать какие-то его фрагменты).


Для печати исходников я использовал 12-ый Courier New, поскольку он моноширинный - проще выравнивать, если хотите, чтобы все было красиво.

Титул и распечатанные исходники брошюруются, то есть дырявятся, прошиваются, концы нити на обороте связываются и на них приклеивается бумажка с надписью "Всего пронумеровано, прошнуровано ___ листов" или "Всего пронумеровано, прошнуровано и скреплено печалью ___ листов". Для случая юридического лица на бумажке должна быть печать организации, а для случая лица физического - его подпись.

4. Документ, подтверждающий оплату пошлины

Сайт ФИПС-а: Памятка об уплате государственной пошлины

5. Сопроводительное письмо

Если правообладатель - организация, то письмо должно быть на бланке организации за подписью руководителя или другого уполномоченного лица и скреплено печатью. Сопроводительное письмо оформляется в соответствии с правилами, принятыми в организациях (например, ставится исходящий номер).


Особенно обращайте внимание на количество листов. Я много раз ошибался: то забыл, что реферат в двух экземплярах, то переделывал доверенность, в результате чего она с одной страницы выросла до двух, и не исправил число листов в сопроводительном и т. д.

С готового сопроводительного письма с подписями и печатями нужно сразу снять копию - на этой копии принимающий заявку специалист ФИПС-а проставит дату принятия документов, после чего вернет эту копию вам (расписка, вроде как).

6. Доверенность

Если правообладателем является юридическое лицо, то в комплекте заявки должна быть доверенность руководителя организации или другого уполномоченного лица, выданная тому, кто непосредственно ведет общение с ФИПС-ом (подает заявку, исправляет неточности). Если доверенность написана грамотно, то большинство мелких проблем, обнаруженных специалистами ФИПС-а на месте, можно решить с помощью ручки и надписи "Исправленному верить" с подписью.

У меня в доверенности был следующий текст:
Федеральное государственное учреждение «Всероссийский научно-исследовательский институт по проблемам гражданской обороны и чрезвычайных ситуаций МЧС России» (федеральный центр науки и высоких технологий), расположенное по адресу 121352, г. Москва, ул. Давыдковская, д. 7, ОГРН: 1027739625550, являющееся обладателем исключительного права на программу для ЭВМ «Оценка эффективности мероприятий, направленных на снижение рисков и смягчение последствий чрезвычайных ситуаций на потенциально опасных объектах», в лице Временно исполняющего обязанности начальника института Дурнева Р. А., действующего на основании Приказа по институту № 65 от 21 июля 2011 г., настоящим доверяет своему представителю Артюхину Валерию Викторовичу (паспорт XX XX XXXXXX выдан XX.XX.XXXXг. XXXXXX) ведение с Федеральной службой по интеллектуальной собственности, патентам и товарным знакам дел, связанных с государственной регистрацией вышеуказанной программы для ЭВМ, для чего уполномочивает представителя осуществлять следующие действия:
  • подписывать заявления, ходатайства и иные документы и материалы заявки на государственную регистрацию вышеуказанной программы для ЭВМ;
  • представлять и получать всякого рода документы, в том числе свидетельство о государственной регистрации;
  • производить уплату тарифов;
  • вносить необходимые дополнения, уточнения, исправления и изменения в представленные документы и материалы, включая реферат (кроме депонируемых идентифицирующих материалов);
  • представлять дополнительные пояснения;
  • подавать заявление об отзыве заявки на государственную регистрацию;
  • выполнять другие юридически значимые действия, связанные с государственной регистрацией вышеуказанной программы для ЭВМ.

Настоящая доверенность действительна в течение трех месяцев с даты ее выдачи.

Образец подписи Артюхина Валерия Викторовича ________________ удостоверяю.

Доверенность оформляется аналогично сопроводительному письму (бланк, исходящий и т. д.). Еще раз повторю: желательно приложить приказ о назначении руководителя организации таковым; если же документы подписывает другое уполномоченное лицо (например, заместитель руководителя), до приказ уполномочивающий его на подобные действия или аналогичная по смыслу доверенность должна быть приложена в обязательном порядке и отражена в сопроводительном письме.

Вот, собственно, и все. После того, как документы собраны, необходимо сдать их по адресу: Москва, Бережковская наб., 30, корп.1 (это последнее здание по Бережковской, от центрального входа направо по указателям) и ждать результата.



read more at АйТи-общественный блог

Жизненный путь: Pilgrim5

16:36 27.08.2011
Жизненный путь: Pilgrim5
Не могу не рассказать. Pilgrim5 - это не язык программирования, это система имитационного моделирования, с которой я работал очень долго и очень много. Разработана она была еще где-то в начале 90-х годов моим научным руководителем Емельяновым А. А. (в то время, конечно, он еще моим руководителем не был, потому что еще нечем было научно руководить). Система имитационного моделирования - это такая штука, которая позволяет настраивать "узлы", "транзакты", "генераторы" и "пути", то есть модели процессов, запускать их и получать всякую статистику. Все, что можно представить в виде системы массового обслуживания, можно представить в виде модели на Pilgrim и обсчитать.

Система имитационного моделирования в данном случае представляет собой просто статическую библиотеку pilgrim.lib, которая ликнуется к проекту, и еще пару заголовочных файлов, которые с помощью инструкций препроцессора до неузнаваемости меняют текст основного исходника проекта. То есть сами не меняют - просто программист должен из-за этих макроопределений набивать в файл такое, что ни капли не похоже на C-шный текст. Вот примерчик:


Такая модель создания хм... моделей оригинальна и, когда начинаешь работать в этой области (а я начал в 1998 или 1999-ом в рамках институтского курса), весьма удобна. Этот мизерный по объему и по сравнению с его же функциональность код, сам создает и окно, и несложные инструменты для анализа процесса, и даже графики строит кое-какие. Конечно, когда требуется модель более сложная, с более богатой визуализацией, с дополнительными расчетами, с подключением к БД, со всякими трюками, наподобие придуманного мною в свое время "парного забега" (долго объяснять) или чем-то подобным, возникают проблемы, которые таким вот нестандартным вынужденным синтаксисом только усугубляются. Но речь сейчас не об этом.

Любопытно то, что даже по сравнению с OpenGL, Pilgrim5, наверное, еще более глубоко и профессионально изученная мною технология. С этой системой я работал долгие годы, создав много крупных и мелких моделей разной степени сложности для разных целей. Вот самые памятные проекты:
  • модель издательства, с учетом работы отделов сбыта, производства, букинистики и т. д. и т. п. с визуализацией, в которой все вертелось, бегало, уменьшалось и увеличивалось, динамически отображая состояние процесса по многим показателям (заказная);
  • модель родного деканата Института компьютерных технологий МЭСИ;
  • модель системы дистанционного обучения и взаимодействия с ней обучаемых с учетом индивидуальных учебных планов, курсов, дисциплин, промежуточного и итогового контроля и прочего, и прочего - для этой модели впервые пришлось подключать БД, из которой программа дергала данные, в БД же была вынесена и большая часть интерфейса для ввода данных, и все проверки этих данных на корректность и целостность, а сама модель стала ядром моей кандидатской диссертации;
  • три больших модели "Структурированной системы мониторинга инженерных систем" (СМИС) - тут тоже понадобилась БД, но не потому что данные были сложные, как в предыдущем случае (там были курсы, темы внутри курсов, индивидуальные планы), а потому что данных было очень много, а само моделирование производилось помиллисекундно (заказная).
Помимо этого я разработал на базе Visio конструктор для имитационных моделей, который позволяет перевести одним щелчком это:


в текст на C, который гарантированно компилируется.

Интересно, что когда ты создаешь модели в Pilgrim-е, ты пишешь на C и не на C одновременно. То есть в тех аспектах, которые выходят за рамки терминологии Pilgrim-a ты должен соблюдать синтаксис и логику C, но большую часть времени ты мыслишь категориями теории массового обслуживания и имитационного моделирования. Программируя внутри Visual Studio, выполняя те же операции и шаги, что и обычно, ты при этом работаешь в основном не с языком программирования, а с чем-то созданным поверх этого языка. Любопытное ощущение.

В общем, работ было много, интереса тоже, хотя в этом году я принял решение больше Pilgrim-овских моделей не разрабатывать - надо в жизни что-то менять иногда. Думаю, может стоит разработать свою систему моделирования? Позаимствовать все лучшее, добавить своих идей, сменить концепцию... и не трогать препроцессор!



read more at АйТи-общественный блог