Информатика Базовый уровень Учебник 10-11 класс Семакин Хеннер

Информатика Базовый уровень Учебник 10-11 класс Семакин Хеннер - 2014-2015-2016-2017 год:

Читать онлайн (cкачать в формате PDF) - Щелкни!

Текст из книги:

и. г. Сема кин Е. К. Хеннер ■ л" ИНФОРМАТИКА ИИКТ ^ИЗДАТЕЛЬСТВО И.Г.Семакин, Е.К.Хеннер ИНФОРМАТИКА И ИКТ БАЗОВЫЙ УРОВЕНЬ Учебник для 10-11 класса 8-е издание Рекомендовано Министерством образования и науки Российской Федерации к использованию в образовательном процессе в имеющих государственную аккредитацию и реализующих образовательные программы общего образования образовательных учреждениях Москва БИНОМ. Лаборатория знаний 2012 Оглавление Введение.....................................................5 Глава 1. Информация..........................................9 § 1. Понятие информации .................................9 § 2. Представление информации, языки, кодирование.......13 § 3. Измерение информации. Объемный подход..............17 § 4. Измерение информации. Содержательный подход........21 Глава 2. Информационные процессы в системах.................25 § 5. Что такое система..................................25 § 6. Информационные процессы в естественных и искусственных системах.............................................32 § 7. Хранение информации................................38 § 8. Передача информации ...............................42 § 9. Обработка информации и алгоритмы...................46 § 10. Автоматическая обработка информации...............50 §11. Поиск данных ......................................54 § 12. Защита информации.................................60 Глава 3. Информационные модели..............................67 § 13. Компьютерное информационное моделирование.........67 § 14. Структуры данных; деревья, сети, графы, таблицы...70 § 15. Пример структуры данных — модели предметной области .... 80 § 16. Алгоритм как модель деятельности..................84 Глава 4. Программно-технические системы реализации информационных процессов..............................91 § 17. Компьютер — универсальная техническая система обработки информации................................91 § 18. Программное обеспечение компьютера................97 § 19. Дискретные модели данных в компьютере. Представление чисел..............................................104 Оглавление § 20. Дискретные модели данных в компьютере. Представление текста, графики и звука............................112 §21. Развитие архитектуры вычислительных систем........119 § 22. Организация локальных сетей......................123 § 23. Организация глобальных сетей.....................129 Глава 5. Технологии использования и разработки информационных систем...............................137 § 24. Понятие информационной системы (ИС), классификация ИС. . 137 § 25. Компьютерный текстовый документ как структура данных . . 142 § 26. Интернет как глобальная информационная система...149 § 27. World Wide Web — Всемирная паутина...............154 § 28. Средства поиска данных в Интернете...............157 § 29. Web-сайт— гиперструктура данных..................160 § 30. Геоинформационные системы.........................163 §31. База данных — основа информационной системы.......169 § 32. Проектирование многотабличной базы данных........173 § 33. Создание базы данных.............................178 § 34. Запросы как приложения информационной системы.....184 § 35. Логические условия выбора данных.................187 Глава 6. Технологии информационного моделирования...........192 § 36. Моделирование зависимостей между величинами......192 §37. Модели статистического прогнозирования.............196 § 38. Моделирование корреляционных зависимостей.........203 § 39. Модели оптимального планирования..................207 Глава 7. Основы социальной информатики......................213 § 40. Информационные ресурсы ...........................213 § 41. Информационное обпцество..........................218 § 42. Правовое регулирование в информационной сфере.....229 § 43. Проблема информационной безопасности..............231 Краткие биографические справки..............................234 Предметный указатель........................................243 Введение Уважаемые старшеклассники! С этой страницы книги начинается ваше знакомство с учебным курсом информатики для 10-х и 11-х классов. Изучение всякого школьного предмета можно сравнить со строительством дома. Только этот дом складывается не из кирпичей и бетонных плит, а из знаний и умений. Строительство всякого дома начинается с фундамента. Очень важно, чтобы фундамент был прочным, потому что на него опирается все остальное сооружение. Фундаментом для курса «Информатика и ИКТ 10-11» являются знания и умения, которые вы получили, изучая курс информатики в основной школе — базовый курс информатики. Вам уже не требуется объяснять, что такое компьютер и как он работает; с какой информацией может работать компьютер; что такое программа и программное обеспечение компьютера; что такое информационные технологии. В базовом курсе информатики вы получили представление о том, в каком виде хранится информация в памяти компьютера, что такое алгоритм, информационная модель. Осваивая базовый курс, вы научились обращаться с клавиатурой, мышью, дисками, принтером; работать в среде операционной системы. Вы получили основные навыки работы с текстовыми и графическими редакторами, с базами данных и электронными таблицами. Все эти знания и навыки вам будут необходимы при изучении курса «Информатика и ИКТ 10-11». Термин «информатика» может употребляться в двух смыслах: • информатика как научная область, предметом изучения которой являются информация и информационные процессы; в которой осуществляется изобретение и создание новых средств работы с информацией; • информатика как практическая область деятельности людей, связанная с применением компьютеров для работы с информацией. Как современная техника немыслима без открытий теоретической физики, так и развитие информатики и информационных технологий невозможно без теории информации, теории алгоритмов и целого ряда других теорий в области кибернетики, лингвистики, семиотики, системологии и прочих наук. В соответствии с современным пониманием, в информатике можно выделить четыре части; Введение 1) теоретическая информатика; 2) средства информатизации; 3) информационные технологии; 4) социальная информатика. Каждая из этих частей, в свою очередь, делится на разделы. Содержание и структура информатики в схематическом виде представлены в таблице : Содержание и структура информатики ТЕОРЕТИЧЕСКАЯ ИНФОРМАТИКА Философские основы информатики. Теория информации. Методы измерения информации. Математические основы информатики. Информационное моделирование. Теория алгоритмов. Представление знаний и интеллектуально-информационные системы 0) S ас хранения и обработки данных Персональные компьютеры. Рабочие станции. Вычислительные системы. Устройства ввода/вывода. Накопители (магнитные, оптические, смеп1анные) 6. А как точнее узнать это число? Пока ваших математических знаний недостаточно для того, чтобы решить это уравнение. Вы научитесь этому в 11-м классе в курсе математики. А сейчас сообщим, что результатом решения уравнения для N = 6 будет значение i = 2,58496 бита с точностью до пяти знаков после запятой. Система основных понятий Измерение информации — содержательный подход Измеряется количество информации в сообщении о результате некоторого события Равновероятные результаты: никакой результат не имеет преимущества перед другими Неопределенность знания — число возможных результатов (вариантов ___________сообщения) — N____________ Количество информации в сообщении об одном результате события — i битов Главная формула информатики: 2‘ = N Частный случай: два равновероятных результата события N=2 i — 1 бит 1 бит — количество информации в сообщении об одном из двух ______равновероятных результатов некоторого события___ Вопросы и задания 1. Что такое неопределенность знания о результате какого-либо события? Приведите примеры, когда неопределенность знания можно выразить количественно. 2. Как определяется единица измерения количества информации? 3. В каких случаях и по какой формуле можно вычислить количество информации, содержащейся в сообщении, используя содержательный подход? 4. Сколько битов информации несет сообщение о том, что из колоды в 32 карты достали «даму пик*? 5. Проводятся две лотереи: «4из32* и «5из 64 *. Сообщение о результатах какой из лотерей несет больше информации и во сколько раз? Глава 2_________________ Информационные процессы в системах Что такое система Системология — наука о системах. В чем состоит содержание этой науки и какое отношение она имеет к информатике, вам предстоит узнать из данной главы. Понятие системы Наш мир наполнен многообразием различных объектов. Нередко мы употребляем понятия «простой объект», «сложный объект». А размышляли ли вы о том, в чем разница между простым и сложным? На первый взгляд, возникает такой очевидный ответ: сложный объект состоит из множества простых. И чем больше в нем таких «деталей», тем предмет сложнее. Например, кирпич — простой объект, а здание, построенное из кирпичей, — сложный объект. Или еще: болт, колесо, руль и другие детали автомобиля — простые объекты, а сам автомобиль, собранный из этих деталей, — сложное устройство. Но только ли в количестве деталей заключается различие между простым и сложным? Сформулируем определение главного понятия системологии — понятия системы: Система — это сложный объект, состоящий из взаимосвязанных частей (элементов) и существующий как единое целое. Всякая система имеет определенное назначение (функцию, цель). Рассмотрим кучу кирпичей и дом, построенный из этих кирпичей. Как бы много ни было кирпичей в куче, ее нельзя назвать системой, потому что в ней нет единства, нет целесообразности. А жилой дом имеет вполне конкретное назначение — в нем можно жить. В кладке дома кирпичи определенным образом взаимо- 26 Глава 2. Информационные процессы в системах связаны, В соответствии с конструкцией. Конечно, в конструкции дома кроме кирпичей имеется много других деталей (доски, балки, окна и пр.), все они нужным образом соединены и образуют единое целое — дом. Вот другой пример: множество велосипедных деталей и собранный из них велосипед. Велосипед — это система. Его назначение — быть транспортным средством для человека. Первое главное свойство системы — целесообразность. Это назначение системы, главная функция, которую она выполняет. Структура системы Всякая система определяется не только составом своих частей, но также порядком и способом объединения этих частей в единое целое. Все части (элементы) системы находятся в определенных отношениях или связях друг с другом. Здесь мы выходим на следующее важнейшее понятие систе-мологии — понятие структуры. Структура — это порядок связей между элементами системы. Можно еще сказать так: структура — это внутренняя организация системы. Из тех же самых кирпичей и других деталей кроме жилого дома можно построить гараж, забор, башню. Все эти сооружения строятся из одних и тех же элементов, но имеют разную конструкцию в соответствии с назначением сооружения. Применяя язык системологии, можно сказать, что они различаются структурой. Кто из вас не увлекался детскими конструкторами: строительными, электрическими, радиотехническими и другими? Все детские конструкторы устроены по одному принципу: имеется множество типовых деталей, из которых можно собирать различные изделия. Эти изделия отличаются порядком соединения деталей, т. е. структурой. Из всего сказанного можно сделать вывод: всякая система обладает определенным элементным составом и структурой. Свойства системы зависят и от того, и от другого. Даже при одинаковом составе системы с разной структурой обладают разными свойствами, могут иметь разное назначение. Второе главное свойство системы — целостность. Нарушение элементного состава или структуры ведет к частичной или полной утрате целесообразности системы. § 5. Что такое система 27 С зависимостью свойств различных систем от их структуры вам приходилось и еще предстоит встретиться в разных школьных дисциплинах. Например, известно, что графит и алмаз состоят из молекул одного и того же химического вещества — углерода. Но в алмазе молекулы углерода образуют кристаллическую структуру, а у графита структура совсем другая — слоистая. В результате алмаз — самое твердое в природе вещество, а графит мягкий, из него делают грифели для карандашей. Пример из физики: все радиосистемы состоят из одинаковых деталей (резисторов, конденсаторов, транзисторов, трансформаторов и пр.), но различные по назначению радиотехнические устройства имеют разную структуру. Рассмотрим пример общественной системы. Общественными системами называют различные объединения (коллективы) людей: семью, производственный коллектив, коллектив школы, бригаду, воинскую часть и др. Связи в таких системах — это отношения между людьми, например отношения подчиненности. Множество таких связей образуют структуру общественной системы. Вот простой пример. Имеются две строительные бригады, состоящие каждая из семи человек. В первой бригаде один бригадир, два его заместителя и по два рабочих в подчинении у каждого заместителя. Во второй бригаде — один бригадир и шестеро рабочих, которые подчиняются непосредственно бригадиру. На рисунках схематически представлены структуры подчиненности в двух данных бригадах: О Таким образом, две эти бригады — пример двух производственных (социальных) систем с одинаковым составом (по 7 человек), но с разной структурой подчиненности. Различие в структуре неизбежно отразится на эффективности работы бригад, на их производительности. При небольшом числе людей эффективнее оказывается вторая структура. Но если в бригаде 20 или 30 человек, то тогда одному бригадиру трудно управлять работой такого коллектива. В этом случае разумно ввести должности заместителей, т. е. использовать первую структуру подчиненности. 28 Глава 2. Информационные процессы в системах Системный эффект Сущность системного эффекта: всякой системе свойственны новые качества, не присущие ее составным частям. Это же свойство выражается фразой: целое больше суммы своих частей. Например, отдельные детали велосипеда: рама, руль, колеса, педали, сиденье не обладают способностью к езде. Но вот эти детали соединили определенным образом, создав систему под названием «велосипед», которая приобрела новое качество — способность к езде, т. е. возможность служить транспортным средством. То же самое можно показать на примере самолета: ни одна часть самолета в отдельности не обладает способностью летать; но собранный из них самолет (система) — летающее устройство. Еще пример: социальная система — строительная бригада. Один рабочий, владеющий одной специальностью (каменщик, сварщик, плотник, крановщик и пр.), не может построить многоэтажный дом, но вся бригада вместе справляется с этой работой. О системах и подсистемах В качестве еще одного примера системы рассмотрим объект, с которым вы часто имеете дело на уроках информатики — персональный компьютер (ПК). На рис. 2.1 приведена схема состава и структуры ПК. Монитор — Принтер — Мышь — Контроллеры Системный блок Клавиатура НЖМД НГМД CD-ROM внешних устройств 99? Информационная магистраль 1 1 1 1 1 1 Центральный Оперативная 1 1 1 1 1 1 1 1 процессор память АЛУ Регистры 1 УУ 1 П Рис. 2.1. Состав и структура персонального компьютера Самое поверхностное описание ПК такое: это система, элементами которой являются системный блок, клавиатура, монитор, принтер, мышь. Можно ли назвать их простыми элементами? Конечно, нет. Каждая из этих частей — это тоже система, состоящая из множества взаимосвязанных элементов. Например, из базового курса информатики вам известно, что в состав системного блока входят: центральный процессор, оператив- § 5. Что такое система 29 ная память, накопители на жестких и гибких магнитных дисках, CD-ROM, контроллеры внешних устройств и пр. В свою очередь, каждое из этих устройств — сложная система. Например, центральный процессор состоит из арифметико-логического устройства, устройства управления, регистров. Так можно продолжать и дальше, все более углубляясь в подробности устройства компьютера. Систему, входящую в состав какой-то другой, более крупной системы, называют подсистемой. Из данного определения следует, что системный блок является подсистемой персонального компьютера, а процессор - подсистемой системного блока. А можно ли сказать, что какая-то простейшая деталь компьютера, например гайка, системой не является? Все зависит от точки зрения. В устройстве компьютера гайка — простая деталь, поскольку на более мелкие части она не разбирается. Но с точки зрения строения вещества, из которого сделана гайка, это не так. Металл состоит из молекул, образующих кристаллическую структуру, молекулы — из атомов, атомы — из ядра и электронов. Чем глубже наука проникает в вещество, тем больше убеждается, что нет абсолютно простых объектов. Даже частицы атома, которые называют элементарными, например электроны, тоже оказались непростыми. Любой реальный объект бесконечно сложен. Описание его состава и структуры всегда носит модельный характер, т. е. является приближенным. Степень подробности такого описания зависит от его назначения. Одна и та же часть системы в одних случаях может рассматриваться как ее простой элемент, в других случаях — как подсистема, имеющая свой состав и структуру. О системах в науке и системном подходе Основной смысл исследовательской работы ученого чаще всего заключается в поиске системы в предмете его исследования. Задача всякой науки — найти системные закономерности в тех объектах и процессах, которые она изучает. Давайте вспомним, где в школьных предметах вам встречалось понятие системы. В XVI веке Николай Коперник описал устройство Солнечной системы'. Земля и другие планеты вращаются вокруг Солнца; связаны они в единое целое силами притяжения. Систематизация знаний очень важна для биологии. В XVIII веке шведский ученый Карл Линней написал книгу под названием «Системы природы». Он сделал первую удачную попытку классифицировать все известные виды животных и растений, а самое главное, показал взаимосвязь, т. е. зависимость одних видов от других. Вся живая природа предстала 30 Глава 2. Информационные процессы в системах как единая большая система. Но она, в свою очередь, состоит из системы растений, системы животных, т. е. подсистем. А среди животных есть птицы, звери, насекомые и т. д. Всё это тоже системы. Русский ученый Владимир Иванович Вернадский в 20-х годах XX века создал учение о биосфере. Под биосферой он понимал систему, включаюш;ую в себя весь растительный и животный мир Земли, человечество, а также их среду обитания: атмосферу, поверхность Земли, мировой океан, разрабатываемые человеком недра (все это названо активной оболочкой Земли). Все подсистемы биосферы связаны между собой и зависят друг от друга. Вернадскому же принадлежит идея о зависимости состояния биосферы от космических процессов, иначе говоря, биосфера является подсистемой более крупных, космических систем. Если человек хочет быть хорошим специалистом в своем деле, он обязательно должен обладать системным мышлением, к любой работе проявлять системный подход. Карл Линней (1707-1778), Швеция Владимир Иванович Вернадский (1863-1945), Россия Суш;ность системного подхода: необходимо учитывать все существенные системные связи того объекта, с которым работаешь. Очень «чувствительным» для всех нас примером необходимости системного подхода является работа врача. Взявшись лечить какую-то болезнь, какой-то орган, врач не должен забывать о взаимосвязи этого органа со всем организмом человека, чтобы не получилось, как в поговорке, «одно лечим, другое калечим». Человеческий организм — очень сложная система, поэтому от врача требуются большие знания и осторожность. Еще один пример — экология. Слово «экология» происходит от греческих слов «экое» — «дом» и «логос» — «учение». Эта наука учит люд ей относиться к окружающей их природе как к собственному дому. Самой важной задачей экологии сегодня стала защита природы от разрушительных последствий человеческой деятельности (использования природных ресурсов, выбросов промышленных отходов и пр.). Со временем люди все больше вмешиваются в природные процессы. Некоторые вмешательства неопасны, но есть такие, которые могут привести к катастрофе. Экология пользуется понятием «экологическая система». Это человек с «плодами» его деятельности (города, транспорт, заводы и пр.) и естественная природа. В идеале в этой системе должно существовать динамическое равновесие, т. е. те разрушения, которые человек неизбежно производит в природе, должны успевать компенсироваться естественными природными процессами или самим человеком. Например, люди, машины, заводы сжигают кислород, а растения его выделяют. Для равновесия надо, чтобы выделялось § 5. Что такое система 31 кислорода не меньше, чем его сжигается. И если равновесие будет нарушено, то в конце концов наступит катастрофа в масштабах Земли. В XX веке экологическая катастрофа произошла с Аральским морем в Средней Азии. Люди бездумно забирали для орошения полей воду из питающих его рек Амударья и Сырдарья. Количество испаряющейся воды превысило приток, и море стало пересыхать. Сейчас оно практически погибло и жизнь на его бывших берегах ни для людей, ни для животных и растений стала невозможной. Вот вам пример отсутствия системного подхода. Деятельность таких «преобразователей природы» очень опасна. В последнее время появилось понятие экологическая грамотностью. Вмешиваясь в природу, нельзя быть узким специалистом: только нефтяником, только химиком и пр. Занимаясь изучением или преобразованием природы, надо видеть в ней систему и прилагать усилия для того, чтобы не нарушать ее равновесия. Система основных понятий Основы системологии Система — это сложный объект, состоящий из взаимосвязанных частей — элементов и существующий как единое целое. Всякая система имеет определенное назначение (функцию, цель) Состав системы Структура системы элемент подсистема связи порядок связей Системный эффект: всякая система приобретает новые качества, не присущие ее составным частям Основные свойства системы Целесообразность — функция, назначение системы Целостность: нарушение элементного состава или структуры ведет к полной или частичной утрате целесообразности системы Системный подход — основа научной методологии: необходимость учета всех существенных системных связей объекта изучения или воздействия Вопросы и задания 1. Что такое система? Приведите примеры. 2. Что такое структура? Приведите примеры. 3. Приведите примеры систем, имеющих одинаковый состав (одинаковые элементы), но разную структуру. 32 Глава 2. Информационные процессы в системах 4. В чем суть системного эффекта? Приведите примеры. 5. Что такое подсистема? 6. В чем состоит цель всякой науки с системной точки зрения? 7. Какие системные открытия в науке сделали Н. Коперник, К. Линней, В. И. Вернадский? Назовите имена других ученых и их открытия, имеющие системный характер. 8. Что такое системный подход? Приведите примеры ситуаций, когда отсутствие системного подхода ведет к катастрофическим последствиям. 9. Выделите подсистемы в следующих объектах, рассматриваемых в качестве систем: костюм; автомобиль; компьютер; городская телефонная сеть; школа; армия; государство. 10. Удаление каких элементов из вышеназванных систем приведет к потере системного эффекта, т. е. к невозможности выполнения их основного назначения? Попробуйте выделить существенные и несущественные элементы этих систем с позиции системного эффекта. Информационные процессы в естественных и искусственных системах Из базового курса вам известно: • Существуют три основных типа информационных процессов: хранение информации, передача информации, обработка информации. • Человек хранит информацию в собственной памяти и на внешних носителях; бумаге, компьютерных дисках и пр. • Процесс передачи информации протекает от источника к приемнику по информационным каналам. • Процесс обработки информации связан с получением новой информации, изменением формы или структуры имеющейся информации, поиском данных в информационном массиве. Естественные и искусственные системы Вернемся к вопросу о связях, существующих между элементами систем. Когда это дом или машина, всё понятно. Кирпичи связаны цементным раствором, детали машины — болтами, сваркой, заклепками. А чем связаны системы животных, растений, или, допустим, система образования? Чтобы разобраться в этом, разделим всевозможные системы на два вида. Существуют естественные системы, или природные, т. е. созданные природой, и искусственные системы — созданные человеком. § 6. Информационные процессы в естественных и искусственных системах 33 Естественные системы: космические системы — галактики, системы звезд и планет, такие, как наша Солнечная система; системы животных и растений; молекулярные и атомные системы. Искусственные системы создают люди. Если хорошо подумать, то можно вспомнить множество таких систем, с которыми мы сталкиваемся в повседневной жизни, — это система городского транспорта, система телефонной связи, система торговли, система образования, система здравоохранения, система водоснабжения, система обороны страны, банковская система, государственная энергетическая система и т. д. Само человеческое обш;ество — это тоже система взаимосвязанных личностей, которые образуют разнообразные подсистемы: семьи, трудовые коллективы, партии, нации, расы и пр. Материальные связи в естественных и искусственных системах Обсудим характер связей в естественных системах. Во-первых, это физические силы, которые, например, удерживают планеты около Солнца на своих орбитах, молекулы углерода в кристалле алмаза; это энергетические процессы, например фотосинтез, превраш;аюш;ий солнечную энергию в энергию жизни растений. Благодаря генетическим связям сохраняются и продолжаются виды животных и растений. Эти связи заключаются в определенной структуре молекул ДНК, входяш;их в состав клеток организма. Можно говорить о климатических связях — они объединяют систему животного и растительного мира в определенной части планеты. Все перечисленные виды связей можно назвать материальными. Теперь об искусственных системах. Есть множество материальных систем, созданных человеком: вся техника (автомобили, самолеты, станки, компьютеры и т. д.), строительные сооружения (дома, мосты, города, плотины, каналы); искусственные материалы (сплавы, пластмассы). Связи в таких системах, как и в естественных, имеют материальный характер. Раньше мы уже говорили о строительных сооружениях, о машинах. Представим еш;е, например, энергосистему: станции, трансформаторы, линии электропередач, электроприборы; все это присоединено одно к другому и согласованно работает. Информационные связи в естественных и искусственных системах Однако в живой природе суш;ествуют системные связи, которые никак нельзя отнести к материальным. Вот, например, стая журавлей, летяш;ая клином на юг. Что удерживает их в таком строю? Журавли видят вожака, ведуш;его стаю, и следуют за ним в определенном порядке. Кроме того, журавли подают друг другу сигналы голосом. Это пример связи, которую можно назвать информационной. Подобные примеры можно привести из жизни животных, рыб и даже насекомых. 2-1415 34 Глава 2. Информационные процессы в системах В системах живой природы существуют связи как материальные, так и информационные. Выше говорилось о материальных искусственных системах. Другой вид искусственных систем — это общественные {социальные) системы, т. е. различные объединения людей. Конечно, между ними тоже есть определенные материальные связи (например, обш;ее помещение, экономическая зависимость, родственно-генетические связи), однако для общественных систем очень важны информационные связи. Ни один коллектив, от семьи до государства, не может существовать без информационного обмена. Еще существуют связи между людьми, основанные на определенных договоренностях, например конституции государства, законодательстве, уставе организации. Кроме того, есть связи, определяемые человеческой этикой — правилами поведения, не записанными в законах: национальные традиции, семейные традиции, правила приличия и т. д. Люди знают эти законы и правила и подчиняются им. А поскольку любые знания — это информация, то такие связи тоже можно назвать информационными. Для функционирования общественных систем важнейшее значение имеют информационные связи. Информационные процессы в системах В чем же состоят информационные связи? Казалось бы, ответ очевиден: в обмене информацией, в передаче информации от одного элемента системы к другому. Но можно ли утверждать, что два других вида информационных процессов — хранение и обработка информации — необязательны для таких систем? Передача информации невозможна без ее хранения: откуда-то информация должна браться при отпргшлении и куда-то помещаться при получении. Возьмем для примера наиболее близкую для вас социальную систему — систему образования. Основной вид связи между двумя типами ее элементов — учителями и учениками — заключается в процессе передачи знаний от учителей к ученикам. Но информация, которую учителя передают ученикам, хранится в учебниках, в конспектах уроков, в памяти учителя. Ученики же сохраняют полученные знания в своей памяти и в тетрадях. В процессе обучения постоянно происходит обработка информации как учителем, так и учениками. При объяснении учебного материала учитель преобразует его, представляя ученикам в разных формах: в текстовой, графической, табличной, на моделях. Ученики, в свою очередь, отвечают на вопросы, решают задачи, а это есть обработка информации. Рассмотрим другие элементы системы образования: министерство и учебные заведения. Это элементы подсистемы управления образованием. В ней также происходит передача информации (передаются распоряжения, планы, отчеты, нормативные документы), хранение информгщии (хранится документация, различные статистические данные), обработка информации (составление той же документации, статистической информации и пр.). § 6. Информационные процессы в естественных и искусственных системах 35 Наконец, рассмотрим технические информационные системы. К ним относятся системы телеграфной и телефонной связи, радио и телевидения, компьютеры и компьютерные сети, сотовые системы связи. Это искусственные системы, созданные людьми для осуществления информационных процессов: хранения, обработки и передачи информации. В базовом курсе информатики рассказывалось о том, что компьютер целенаправленно создавался изобретателями как универсальный автомат для хранения, обработки и передачи информации. Поэтому все три вида информационных процессов в нем реализованы по определению. Ну а, например, мобильный телефон? Основное его назначение состоит в приеме и передаче информации. Где же здесь хранение и обработка? На рис. 2.2 схематически показан процесс осуществления передачи и приема SMS-сообщения посредством сотовой связи. Набор текста на клавиатуре с отражением на экране телефона и сохранение в его памяти Преобразовани в радиосигнал определенной частоты Передача по каналам сотовой связи Прием сигналг аппаратом адресата. Перевод во внутренний Хранение исходного текста Кодирование обработка текста Декодирование -обработка радиосигнала Сохранение в памяти принимающего аппарата Хранение полученного текста Рис. 2.2. Информационные процессы сотовой связи Из этой схемы видно, что в процессе работы системы сотовой связи происходит хранение, передача и обработка информации. Аналогично можно описать работу других вышеназванных технических систем, в которых имеют место все три вида информационных процессов. Системы управления Из базового курса информатики вам известно, что изучением процессов управления занимается наука кибернетика. Начало кибернетике положил американский ученый Норберт Винер своей книгой «Кибернетика, или Управление и связь в животном и машине», вышедшей в 1948 году. # / Норберт Винер (1894-1964), США Под управлением понимается планомерное воздействие на некоторый объект с целью достижения определенного результата. 36 Глава 2. Информационные процессы в системах С ТОЧКИ зрения кибернетики, процесс управления рассматривается как функционирование системы управления. Эта система состоит из двух подсистем: объекта управления и управляющей системы. Кибернетическая модель управления приведена на рис. 2.3. Обратная связь Рис. 2.3. Кибернетическая модель процесса управления Управляющей системой может быть человек (шофер, дирижер оркестра, учитель, директор), коллектив (правительство, парламент), а может быть и техническое устройство (автоматический регулятор, компьютер). Объектом управления может быть техническое устройство (автомобиль), один человек (ученик, солдат) или коллектив (оркестр, работники предприятия). Взаимодействие, существующее между двумя этими подсистемами в процессе управления, кибернетика рассматривает как информационную связь. По линии прямой связи передаются команды управления от управляющей системы к объекту управления. По линии обратной связи — информация о состоянии объекта управления, о его реакции на управляющее воздействие, а также о состоянии окружающей среды, которая тоже может влиять на процесс управления. Схема на рис. 2.3 оказывается универсальной для всех типов систем, как искусственных, так и естественных, где происходит управление. Все компоненты системы управления имеются в организмах животного и человека. Мозг — управляющая система, органы движения — объекты управления, нервная система — каналы информационной связи. В системах управления осуществляется передача информации, а также ее хранение и обработка. Хранить и обрабатывать информацию приходится как управляющей системе, так и объектам управления (ученик, солдат, трудовой коллектив тоже хранят и обрабатывают информацию, поступающую к ним в процессе управления). Процесс управления происходит по программе, заложенной в память управляющей системы. Если управляющая система способна к собственному программированию, то ее можно назвать самоуправляемой системой. Элементы самоуправления присущи представителям животного мира. В наибольшей степени способностью к самоуправлению обладает человек. § 6. Информационные процессы в естественных и искусственных системах 37 Система основных понятий Информационные процессы в системах Естественные системы Искусственные системы Неживой природы Живой природы Технические Общественные Материальные связи Материальные связи + информационные связи Процессы осуществления информационных связей Хранение информации Передача информации Обработка информации Управление — сложный информационный процесс, включающий в себя хранение, передачу и обработку информации Вопросы и задания 1. Какие системы называются естественными системами, искусственными системами? Приведите примеры тех и других. 2. Приведите примеры материальных и информационных связей в естественных системах. 3. Что такое общественные системы? 4. Приведите примеры материальных и информационных связей в общественных системах. 5. Исследуйте школу, в которой вы учитесь, как систему: • Какого типа эта система: естественная или искусственная? • Выделите входящие в нее подсистемы. • Выделите материальные и информационные связи. • Какие, с вашей точки зрения, изменения в структуре школы следует сделать, чтобы она лучшим образом выполняла свое назначение? 6. Что такое система управления? Из каких компонентов она состоит? Какие типы связи действуют в этой системе? 7. Что такое самоуправляемая система? Приведите примеры. 8. Рассмотрите езду на автомобиле как систему управления. Выделите все кибернетические компоненты в этой системе. 9. Может ли существовать система управления без линии обратной связи? К каким последствиям это может привести? (Рассмотрите на примере управления автомобилем.) 10. Рассмотрите школьный урок как систему управления. Опишите все кибернетические компоненты этой системы. Обратите внимание на множественность различных механизмов прямой и обратной связи. 38 Глава 2. Информационные процессы в системах Хранение информации Из базового курса вам известно: Человек хранит информацию в собственной памяти, а также в виде записей на различных внешних (по отношению к человеку) носителях: на камне, папирусе, бумаге, магнитных и оптических носителях и пр. Благодаря таким записям, информация передается не только в пространстве (от человека к человеку), но и во времени — из поколения в поколение. Рассмотрим способы хранения информации более подробно. Информация может храниться в различных видах: в виде записанных текстов, рисунков, схем, чертежей; фотографий, звукозаписей, кино- или видеозаписей. В каждом случае применяются свои носители. Носитель — это материальная среда, используемая для записи и хранения информации. Практически носителем информации может быть любой материальный объект. Информацию можно сохранять на камне, дереве, стекле, ткани, песке, теле человека и т. д. Здесь мы не станем обсуждать различные исторические и экзотические варианты носителей. Ограничимся современными средствами хранения информации, имеющими массовое применение. Использование бумажных носителей информации Носителем, имеющим наиболее массовое употребление, до сих пор остается бумага. Изобретенная во II веке н. э. в Китае, бумага служит людям уже 19 столетий. Для сопоставления объемов информации на разных носителях будем пользоваться единицей — байтом, считая, что один знак текста «весит» 1 байт. Нетрудно подсчитать информационный объем книги, содержащей 300 страниц с размером текста на странице примерно 2000 символов. Текст такой книги имеет объем примерно 600 000 байтов, или 586 Кб. Средняя школьная библиотека, фонд которой составляют 5000 томов, имеет информационный объем приблизительно 2861 Мб = 2,8 Гб. Что касается долговечности хранения документов, книг и прочей бумажной продукции, то она очень сильно зависит от качества бумаги, красителей, используемых при записи текста, условий хранения. Интересно, что до середины XIX века (с этого времени для производства бумаги начали использовать древесину) бумага делалась из хлопка и текстильных отходов — тряпья. Черни- § 7. Хранение информации 39 лами служили натуральные красители. Качество рукописных документов того времени было довольно высоким, и они могли храниться тысячи лет. С переходом на древесную основу, с распространением машинописи и средств копирования, с началом использования синтетических красителей срок хранения печатных документов снизился до 200-300 лет. На первых компьютер£1х бумажные носители использовались для цифрового представления вводимых данных. Это были перфокарты: картонные карточки с отверстиями, храняпцие двоичный код вводимой информации. На некоторых типах ЭВМ для тех же целей применялась перфорированная бумажная лента. Использование магнитных носителей информации В XIX веке была изобретена магнитная запись. Первоначально она использовалась только для сохранения звука. Самым первым носителем магнитной записи была стальная проволока диаметром до 1 мм. В начале XX столетия для этих целей использовалась также стальная катаная лента. Тогда же (в 1906 г.) был выдан и первый патент на магнитный диск. Качественные характеристики всех этих носителей были весьма низкими. Достаточно сказать, что для производства 14-часовой магнитной записи устных докладов на Международном конгрессе в Копенгагене в 1908 г. потребовалось 2500 км, или около 100 кг проволоки. В 20-х годах XX века появляется магнитная лента сначала на бумажной, а позднее — на синтетической (лавсановой) основе, на поверхность которой наносится тонкий слой ферромагнитного порошка. Во второй половине XX века на магнитную ленту научились записывать изображение, появляются видеокамеры, видеомагнитофоны. На ЭВМ первого и второго поколений магнитная лента использовалась как единственный вид сменного носителя для устройств внешней памяти. Любая компьютерная информация на любом носителе хранится в двоичном (цифровом) виде. Поэтому независимо от вида информации: текст это, или изображение, или звук — ее объем можно измерить в битах и байтах. На одну катушку с магнитной лентой, использовавшейся в лентопротяжных устройствах первых ЭВМ, помещалось приблизительно 500 Кб информации. С начала 1960-х годов в употребление входят компьютерные магнитные диски: алюминиевые или пластмассовые диски, покрытые тонким магнитным порошковым слоем толщиной в несколько микрон. Информация на диске располагается по круговым концентрическим дорожкам. Магнитные диски бывают жесткими и гибкими, сменными и встроенными в дисковод компьютера. Последние традиционно называют винчестерскими дисками. Винчестер компьютера — это пакет магнитных дисков, надетых на общую ось. Информационная емкость современных винчестерских дисков 40 Глава 2. Информационные процессы в системах измеряется в гигабайтах (десятки и сотни Гб). Наиболее распространенный тип гибкого диска диаметром 3,5 дюйма вмещает около 1,4 Мб данных. Гибкие диски в настоящее время выходят из употребления. В банковской системе большое распространение получили пластиковые карты. На них тоже используется магнитный принцип записи информации, с которой работают банкоматы, кассовые аппараты, связанные с информационной банковской системой. Использование оптических дисков и флэш-памяти Применение оптического, или лазерного, способа записи информации начинается в 1980-х годах. Его появление связано с изобретением квантового генератора — лазера, источника очень тонкого (толщина порядка микрона) луча высокой энергии. Луч способен выжигать на поверхности плавкого материала двоичный код данных с очень высокой плотностью. Считывание происходит в результате отражения от такой «перфорированной» поверхности лазерного луча с меньшей энергией («холодного» луча). Благодаря высокой плотности записи, оптические диски имеют гораздо больший информационный объем, чем однодисковые магнитные носители. Информационная емкость оптического диска составляет от 190 Мб до 700 Мб. Оптические диски называются компакт-дисками (CD). Во второй половине 1990-х годов появились цифровые универсальные видеодиски DVD (Digital Versatile Disk) с большой емкостью, измеряемой в гигабайтах (до 17 Гб). Увеличение их емкости по сравнению с CD-дисками связано с использованием лазерного луча меньшего диаметра, а также двухслойной и двусторонней записи. Вспомните пример со школьной библиотекой. Весь ее книжный фонд можно разместить на одном DVD. В настоящее время оптические диски (CD и DVD) являются наиболее надежными материальными носителями информации, записанной цифровым способом. Эти типы носителей бывают как однократно записываемыми — пригодными только для чтения, так и перезаписываемыми — пригодными для чтения и записи. В последнее время появилось множество мобильных цифровых устройств: цифровые фото- и видеокамеры, МРЗ-плееры, карманные компьютеры, мобильные телефоны, устройства для чтения электронных книг, GPS-навигаторы и др. Все эти устройства нуждаются в переносных носителях информации. Но поскольку все мобильные устройства довольно миниатюрные, то и к носителям информации для них предъявляются особые требования. Они должны быть компактными, обладать низким энергопотреблением при работе, быть энергонезависимыми при хранении, иметь большую емкость, высокие скорости записи и чтения, долгий срок службы. Всем этим требованиям удовлетворяют флэш-карты памяти. Информационный объем флэш-карты может составлять несколько гигабайтов. В качестве внешнего носителя для компьютера широкое распространение получили так называемые флэш-брелоки (их называют в просторечии «флэшки»), выпуск которых начался в 2001 году. Большой объем информации, компактность, высокая скорость § 7. Хранение информации 41 чтения/записи, удобство в использовании — основные достоинства этих устройств. Флэш-брелок подключается к USB-порту компьютера и позволяет скачивать данные со скоростью около 10 Мб в секунду. В последние годы активно ведутся работы по созданию еще более компактных носителей информации с использованием так называемых нанотехнологий, работающих на уровне атомов и молекул вещества. В результате один компакт-диск, изготовленный по нанотехнологии, сможет заменить тысячи лазерных дисков. По предположениям экспертов приблизительно через 20 лет плотность хранения информации возрастет до такой степени, что на носителе объемом примерно с кубический сантиметр можно будет записать каждую секунду человеческой жизни. Система основных понятий Хранение информации Носители информации Нецифровые Цифровые (компьютерные) Исторические: камень, дерево, папирус, пергамент, шелк идр. Современные: бумага Магнитные Ленты Диски Карты Оптические CD DVD Флэш-носители Флэш- карты Флэш- брелоки Факторы качества носителей Вместимость — плотность хранения данных, объем данных Надежность хранения — максимальное время сохранности данных, зависимость от условий хранения Наибольшей вместимостью и надежностью на сегодня обладают оптические носители CD и DVD Перспективные виды носителей: носители на базе нанотехнологий Вопросы и задания 1. Какая, с вашей точки зрения, сохраняемая информация имеет наибольшее значение для всего человечества, для отдельного человека? 2. Назовите известные вам крупные хранилища информации. 3. Можно ли человека назвать носителем информации? 4. Где и когда появилась бумага? 5. Когда была изобретена магнитная запись? Какими магнитными носителями вы пользуетесь или пользовались? 6. Какое техническое изобретение позволило создать оптические носители информации? Назовите типы оптических носителей. 7. Назовите сравнительные преимущества и недостатки магнитных и оптических носителей. 42 Глава 2. Информационные процессы в системах 8. Что означает свойство носителя «только для чтения»? 9. Какими устройствами, в которых используются флэш-карты, вы пользуетесь? Какой у них информационный объем? 10. Какие перспективы, с точки зрения хранения информации, открывают нанотехнологии? Передача информации Из базового курса вам известно: • Распространение информации происходит в процессе ее передачи. • Процесс передачи информации протекает от источника к приемнику по информационным каналам связи. В этом параграфе более подробно будут рассмотрены технические системы передачи информации. В § 2 уже говорилось о том, что первой в истории технической системой передачи информации стал телеграф. В 1876 году американец Александр Белл изобрел телефон. На основании открытия немецким физиком Генрихом Герцем электромагнитных волн (1886 год), А. С. Попов в России в 1895 году и почти одновременно с ним в 1896 году Г. Маркони в Италии изобрели радио. Телевидение и Интернет появились в XX веке. Модель передачи информации К. Шеннона Все перечисленные способы информационной связи основаны на передаче на расстояние физического (электрического или электромагнитного) сигнала и подчиняются некоторым общим законам. Исследованием этих законов занимается теория связи, возникшая в 1920-х годах. Математический аппарат теории связи — математическую теорию связи, разработал американский ученый Клод Шеннон. Клодом Шенноном была предложена модель процесса передачи информации по техническим каналам связи, представленная схемой на рис. 2.4. Работу такой схемы можно пояснить на знакомом всем процессе разговора по телефону. Источником информации является говорящий человек. Кодирующим устройством — микрофон телефонной трубки, с помощью которого звуковые волны (речь) преобразуются в электрические сигналы. Каналом связи служит телефонная сеть (провода, коммутаторы телефонных узлов, через которые проходит сигнал). Декодирующим устройством является телефонная трубка (наушник) слушающего человека — прием- Клод Элвуд Шеннон (1916-2001), США § 8. Передача информации 43 Рис. 2.4. Модель передачи информации по техническим каналам связи ника информации. Здесь пришедший электрический сигнал преврапдает-ся в звук. В § 2 уже говорилось о кодировании на примере передачи информации через письменный документ. Кодирование там было определено как процесс представления информации в виде, удобном для ее хранения и/или передачи. Применительно к процессу передачи информации по технической системе связи под кодированием понимается любое преобразование информации, идущей от источника, в форму, пригодную для ее передачи по каналу связи. В § 6 на рис. 2,2 представлена схема передачи информации по сотовой связи в форме SMS-сообпдения. Там кодирование и декодирование заключаются в преобразовании письменного текста в последовательности электромагнитных сигналов и обратном преобразовании. Современные компьютерные системы передачи информации — компьютерные сети, работают по тому же принципу. Есть процесс кодирования, преобразуюпдий двоичный компьютерный код в физический сигнал того типа, который передается по каналу связи. Декодирование заключается в обратном преобразовании передаваемого сигнала в компьютерный код. Например, при использовании телефонных линий в компьютерных сетях функции кодирования/декодирования выполняет прибор, который называется модемом. Пропускная способность канала и скорость передачи информации Разработчикам технических систем передачи информации приходится решать две взаимосвязанные задачи: как обеспечить наибольшую скорость передачи информации и как уменьшить потери информации при передаче. К. Шеннон был первым ученым, взявшимся за решение этих задач и создавшим новую для того времени науку — теорию информации. Шеннон определил способ измерения количества информации, передаваемой по каналам связи. Им было введено понятие пропускной способности канала как максимально возможной скорости передачи информации. Эта скорость измеряется в битах в секунду (а также килобитах в секунду, мегабитах в секунду). 44 Глава 2. Информационные процессы в системах Пропускная способность канала связи зависит от его технической реализации. Например, в компьютерных сетях используются следующие средства связи: • телефонные линии; • электрическая кабельная связь; • оптоволоконная кабельная связь; • радиосвязь. Пропускная способность телефонных линий — десятки и сотни Кбит/с; пропускная способность оптоволоконных линий и линий радиосвязи измеряется десятками и сотнями Мбит/с. Скорость передачи информации связана не только с пропускной способностью канала связи. Представьте себе, что текст на русском языке, содержащий 1000 знаков, передается с использованием двоичного кодирования. В первом случае используется телеграфная 5-разрядная кодировка. Во втором случае — компьютерная 8-разрядная кодировка. Тогда длина кода сообщения в первом случае составит 5000 битов, во втором случае — 8000 битов. При передаче по одному и тому же каналу второе сообщение будет передаваться дольше в 1,6 раза (8000/5000). Отсюда, казалось бы, следует вывод: длину кода сообщения нужно делать минимально возможной. Однако существует другая проблема, которая на рис. 2.4 отмечена словом «шум». Шум, защита от шума Термином «шум» называют разного рода помехи, искажающие передаваемый сигнал и приводящие к потере информации. Такие помехи, прежде всего, возникают по техническим причинам, таким как плохое качество линий связи, незащищенность друг от друга различных потоков информации, передаваемых по одним и тем же каналам. Иногда, беседуя по телефону, мы слышим шум, треск, мешающие понять собеседника, или на наш разговор накладывается разговор других людей. Наличие шума приводит к потере передаваемой информации. В таких случаях необходима защита от шума. Для этого в первую очередь применяются технические способы защиты каналов связи от воздействия шумов. Такие способы бывают самыми разными, иногда простыми, иногда очень сложными. Например: использование экранированного кабеля вместо «голого» провода; применение разного рода фильтров, отделяющих полезный сигнал от шума и пр. Шеннон разработал специальную теорию кодирования, дающую методы борьбы с шумом. Одна из важных идей этой теории состоит в том, что передаваемый по линии связи код должен быть избыточным. За счет этого потеря какой-то части информации при передаче может быть компенсирована. Например, если при разговоре по телефону вас плохо слышно, то, повторяя каждое слово дважды, вы имеете больше шансов на то, что собеседник поймет вас правильно. Избыточность кода — это многократное повторение передаваемых данных. § 8. Передача информации 45 Однако нельзя делать избыточность слишком большой. Это приведет к задержкам и удорожанию связи. Теория кодирования как раз и позволяет получить такой код, который будет оптимальным: избыточность передаваемой информации будет минимально возможной, а достоверность принятой информации — максимальной. Большой вклад в научную теорию связи внес известный советский ученый Владимир Александрович Котельников. В 1940-1950-х годах им получены фундаментальные научные результаты по проблеме помехоустойчивости систем передачи информации. В современных систем£1х цифровой связи для борьбы с потерей информации при передаче часто применяется следующий прием. Все сообщение разбивается на порции — блоки. Для каждого блока вычисляется контрольная сумма (сумма двоичных цифр), которая передается вместе с данным блоком. В месте приема заново вычисляется контрольная сумма принятого блока и, если она не совпадает с первоначальной суммой, передача данного блока повторяется. Так происходит до тех пор, пока исходная и конечная контрольные суммы не совпадут. Владимир Александрович Котельников (1908-2005), Россия Система основных понятий Передача информации в технических системах связи Модель К. Шеннона Процедура кодирования Процесс передачи по каналу связи Процедура декодирования Пропускная Воздействие шумов способность канала на канал связи Защита информации от потерь при воздействии шума Кодирование с оптимальноизбыточным кодом Частичная потеря избыточной информации при передаче Полное восстановление исходного сообщения Вопросы и задания 1. Для чего нужна процедура кодирования передаваемой информации? 2. Что такое декодирование? Каким должен быть его результат? 3. Каким техническим средством связи вы чаще всего пользуетесь? Замечали ли вы при этом факты потери информации? 4. Назовите устройства кодирования и декодирования при использовании радиосвязи. 5. Что такое шум по отношению к системам передачи данных? 46 Глава 2. Информационные процессы в системах 6. Какие существуют способы борьбы с шумом? 7. Пропускная способность канала связи 100 Мбит/с. Канал не подвержен воздействию шума (например, оптоволоконная линия). Определите, за какое время по каналу будет передан текст, информационный объем которого составляет 100 Кб. 8. Пропускная способность канала связи 10 Мбит/с. Канал подвержен воздействию шума, поэтому избыточность кода передачи состгшляет 20%. Определите, за сколько времени по каналу будет передан текст, информационный объем которого составляет 100 Кб. Обработка информации и алгоритмы Из базового курса вам известно: Обработка информации, наряду с хранением и передачей, относится к основным видам информационных процессов. Варианты обработки информации Обработка информации производится каким-то субъектом или объектом (например, человеком или компьютером) в соответствии с определенными правилами. Будем его называть исполнителем обработки информации. Информация, которая подвергается обработке, представляется в виде исходных данных. На рис. 2.5 в обобщенном виде представлен процесс обработки информации. Можно привести множество примеров, иллюстрирующих схему на рис. 2.5. Первый пример: ученик (исполнитель), решая задачу по математике, производит обработку информации. Исходные данные содержатся в условии задачи. Математические правила, описанные в учебнике, определяют последовательность вычислений. Результат — это полученный ответ. § 9. Обработка информации и алгоритмы 47 Второй пример: перевод текста с одного языка на другой — это пример обработки информации, при которой не меняется ее содержание, но изменяется форма представления — другой язык. Перевод осуществляет переводчик по определенным правилам, в определенной последовательности. Третий пример: работник библиотеки составляет -| картотеку книжного фонда. На каждую книгу заполняется карточка, на которой указываются все параметры книги: автор, название, год издания, объем и пр. Из карточек формируется каталог библиотеки, где эти карточки располагаются в строгом порядке. Например, в алфавитном каталоге карточки располагаются в алфавитном порядке фамилий авторов. Четвертый пример: в телефонной книге вы ищете телефон нужной вам организации, например плавательного бассейна; или в том же библиотечном каталоге разыскиваете сведения о нужной вам книге. В обоих случаях исходными данными является информационный массив — телефонный справочник или каталог библиотеки, а также критерии поиска — название организации или фамилия автора и название книги. Приведенные примеры иллюстрируют четыре различных вида обработки информации: 1) получение новой информации, новых сведений; 2) изменение формы представления информации; 3) систематизация, структурирование данных; 4) поиск информации. Все эти виды обработки может выполнять как человек, так и компьютер. В чем состоит принципиальное различие между процессами обработки, выполняемыми человеком и машиной? Если исполнителем обработки информации является человек, то правила обработки, по которым он действует, не всегда формальны и однозначны. Человек часто действует творчески, неформально. Даже однотипные математические задачи он может решать разными способами. Работа журналиста, згченого, переводчика и других специалистов — это творческая работа с информацией, которая выполняется ими не по формальным правилам. Об алгоритмах Для обозначения формализованных правил, определяющих последовательность шагов обработки информации, в информатике используется понятие алгоритма. 48 Глава 2. Информационные процессы в системах Аль-Хорезми (780-850 гг. н.э.) Из базового курса информатики вы знаете, что слово «алгоритм» произошло от имени выдающегося математика средневекового Востока Мухаммеда аль-Хорезми, описавшего еще в IX веке правила выполнения вычислений с многозначными десятичными числами. Правила сложения, вычитания, умножения столбиком, деления «уголком», которым вас учили в младших классах, — это алгоритмы аль-Хорезми. С понятием алгоритма в математике ассоциируется известный способ вычисления наибольшего общего делителя (НОД) двух натуральных чисел, который называют алгоритмом Евклида. В словесной форме его можно описать так: 1. Если числа не равны, то большее из них заменить на разность большего и меньшего из чисел. 2. Если два числа равны, то за НОД принять любое из них, иначе перейти к выполнению пункта 1. Первоклассник, который не знает, что такое НОД, но умеет сравнивать целые числа и выполнять вычитание, сможет исполнить алгоритм. Действовать при этом он будет формально. Такой формализованный алгоритм легко запрограммировать для современного компьютера. Мечта создать машину — автоматическое устройство, которое сможет без вмешательства человека производить расчеты, появилась очень давно. Для ее реализации требовались не только технические возможности, но и глубокое понимание сущности алгоритмов обработки информации и разработка формализованного способа представления таких алгоритмов. Алгоритмические машины и свойства алгоритмов В 30-х годах XX века возникает новая наука — теория алгоритмов. Вопрос, на который ищет ответ эта наука: для всякой ли задачи обработки информации может быть построен алгоритм решения? Но чтобы ответить на этот вопрос, надо сначала договориться об исполнителе, на которого должен быть ориентирован алгоритм. Английский ученый Алан Тьюринг предложил модель такого исполнителя, получившую название «машина Тьюринга». По замыслу Тьюринга, его «машина» является универсальным исполнителем обработки любых символьных последовательностей в любом алфавите. Практически одновременно с Тьюрингом (1936-1937 гг.) другую модель алгоритмической машины описал Эмиль Пост. Машина Поста работает с двоичным алфавитом и несколько проще в своем «устройстве». Можно сказать, что машина Поста является частным случаем машины Тьюринга. Однако именно работа с двоичным алфавитом представляет наибольший интерес, поскольку, как вы знаете, современный компьютер тоже работает с двоичным алфавитом. Подробнее с машиной Поста вы познакомитесь в следующем параграфе. Алан Тьюринг (1912-1954), Англия § 9. Обработка информации и алгоритмы 49 На основании моделей Тьюринга, Поста и некоторых других ученые пришли к выводу о существовании алгоритмически неразрешимых задач. Язык программирования алгоритмических машин представляет собой описание конечного числа простых команд, которые могут быть реализованы в автоматическом устройстве. Совокупность всех команд языка исполнителя называется системой команд исполнителя алгоритмов — СКИ. Алгоритм управления работой алгоритмической машины представляет собой конечную последовательность команд, посредством выполнения которой машина решает задачу обработки информации. Алгоритм управления такой машиной должен обладать следующими свойствами: • дискретностью (каждый шаг алгоритма выполняется отдельно от других); • понятностью (в алгоритме используются только команды из СКИ); • точностью (каждая команда определяет однозначное действие исполнителя); • конечностью (за конечное число шагов алгоритма получается искомый результат). Отметим разницу между понятиями «команда алгоритма» и «шаг алгоритма». Команда — это отдельная инструкция в описании алгоритма, а шаг алгоритма — это отдельное действие, которое исполнитель выполняет по команде. В циклических алгоритмах число шагов при выполнении алгоритма может быть больше, чем число команд в алгоритме, за счет повторного выполнения одних и тех же команд. Вопросы и задания 1. Приведите примеры процессов обработки информации, которые чаще всего вам приходится выполнять во время учебы. Для каждого примера определите исходные данные, результаты и правила обработки. К каким видам обработки относятся ваши примеры? 2. Если вы решаете задачу по математике или физике и при этом используете калькулятор, то какова ваша функция в этом процессе и какова функция калькулятора? 3. Используя алгоритм Евклида, найдите НОД для чисел 114 и 66. Сколько шагов алгоритма при этом вам пришлось выполнить? 4. Какие проблемы решает теория алгоритмов? 5. Почему калькулятор нельзя назвать алгоритмической машиной, а компьютер можно? 6. Придумайте минимально необходимую систему команд для кассового аппарата, который подсчитывает стоимость покупок и сумму сдачи покупателю. Опишите алгоритм управления работой таким автоматом. 50 Глава 2. Информационные процессы в системах Система основных понятий Обработка информации Виды обработки информации Получение новой информации (новых данных) Изменение формы представления информации Структурирование данных Поиск данных Исполнитель обработки Человек Автомат (машина) Алгоритм обработки — формализованные правила, определяющие последовательность шагов обработки информации Алгоритмическая машина — автоматический исполнитель обработки знаковых последовательностей Модели алгоритмических машин в теории алгоритмов Машина Тьюринга Машина Поста Свойства алгоритма Дискретность: каждый шаг алгоритма выполняется отдельно от других Понятность: в алгоритме используются только команды из СКИ Точность: каждая команда определяет однозначное действие исполнителя Конечность: за конечное число шагов алгоритма получается искомый результат Автоматическая обработка информации В качестве примера автомата, выполняющего обработку информации, рассмотрим машину Э. Поста. Алгоритм, по которому работает машина Поста, будем называть программой. Договоримся о терминологии: под словом «программам мы всегда будем понимать алгоритм, записанный по строгим правилам языка команд исполнителя — на языке программирования для данного исполнителя. Опишем архитектуру машины Поста (рис. 2.6). Имеется бесконечная информационная лента, разделенная на позиции — клетки. В каждой клетке может либо стоять метка (некоторый знак), либо отсутствовать (пусто). Эмиль Пост (1897-1954), США § 10. Автоматическая обработка информации 51 V V V V V Рис. 2.6. Модель машины Поста Вдоль ленты движется каретка — считывающее устройство. На рисунке она обозначена стрелкой. Каретка может передвигаться шагами; один шаг — смещение на одну клетку вправо или влево. Клетку, под которой установлена каретка, будем называть текущей. Каретка является еще и процессором машины. С ее помощью машина может: • распознать, пустая клетка или помеченная знаком; • стереть знак в текущей клетке; • записать знак в пустую текущую клетку. Если произвести замену меток на единицы, а пустых клеток — на нули, то информацию на ленте можно будет рассматривать как аналог двоичного кода телеграфного сообщения или данных в памяти компьютера. Существенное отличие каретки-процессора машины Поста от процессора компьютера состоит в том, что в компьютере возможен доступ процессора к ячейкам памяти в произвольном порядке, а в машине Поста — только последовательно. Назначение машины Поста — производить преобразования на информационной ленте. Исходное состояние ленты можно рассматривать как исходные данные задачи, конечное состояние ленты — результат решения задачи. Кроме того, в исходные данные входит информация о начальном положении каретки. Теперь рассмотрим систему команд машины Поста (табл. 2.1). Запись всякой команды начинается с ее порядкового номера в программе — п. Затем следует код операции и после него — номер следующей выполняемой команды программы — т: Таблица 2.1. Система команд машины Поста Команда Действие п <— m Сдвиг каретки на шаг влево и переход к выполнению команды с номером m п —> m Сдвиг каретки на шаг вправо и переход к выполнению команды с номером m п V m Запись метки в текущую пустую клетку и переход к выполнению команды с номером пп п I m Стирание метки в текущей клетке и переход к выполнению команды с номером m п ! Остановка выполнения программы п ? т, к Переход в зависимости от содержимого текущей клетки: если текущая клетка пустая, то следующей будет выполняться команда с номером т, если непустая — команда с номером к 52 Глава 2. Информационные процессы в системах Рассмотрим пример программы решения задачи на машине Поста. Исходное состояние показано на рис. 2.6. Машина должна стереть знак в текущей клетке и присоединить его слева к группе знаков, расположенных справа от каретки. Программа приведена в табл. 2.2. Таблица 2.2. Программа для машины Поста Команда Действие 1 I 2 Стирание метки; переход к следующей команде 2^3 Сдвиг вправо на один шаг 3 ? 2, 4 Если клетка пустая, то переход к команде 2, иначе — к команде 4 4 <- 5 Сдвиг влево на шаг (команда выполнится, когда каретка выйдет на первый знак группы) 5 V б Запись метки в пустую клетку 6 ! Остановка машины В процессе выполнения приведенной программы многократно повторяется выполнение команд с номерами 2 и 3. Такая ситуация называется циклом. Напомним, что цикл относится к числу основных алгоритмических структур вместе со следованием и ветвлением. А теперь научим машину Поста играть в интеллектуальную игру, которая называется «Игра Баше». Опишем правила игры. Играют двое. Перед ними 21 (или 16, или Пит. д.) фишка. Игроки берут фишки по очереди. За один ход можно взять от 1 до 4 фишек. Проигрывает тот, кто забирает последнюю фишку. Имеется выигрышная тактика для игрока, берущего фишки вторым. Она заключается в том, чтобы брать такое количество фишек, которое дополняет число фишек, взятых соперником на предыдущем ходе, до пяти. Роль фишек на информационной ленте машины Поста будут выполнять метки (знаки). Машина играет с человеком. Человеку предоставляется возможность стирать метки (брать фишки) первым. Машина будет вступать в игру второй. Исходная обстановка: на ленте массив из 21 клетки содержит метки. Каретка установлена на крайней слева клетке этого массива. Стирать метки можно только подряд. Выигрышным результатом должна быть одна оставшаяся метка перед очередным ходом человека. Еще раз напомним принцип выигрышной тактики: стирать столько меток, чтобы в сумме с метками, стертыми противником за предыдущий ход, их было пять. Программа управления машиной Поста в игре Баше против человека приведена в табл. 2.3. Действуя по данной программе и начиная стирать метки второй после человека, машина всегда будет выигрывать, если правильно задано начальное число меток, которое должно быть равно 5п + 1, где п — любое натуральное число. В противном случае машина может проиграть. § 10. Автоматическая обработка информации 53 Таблица 2.3. Программа игры Баше Команда Действие 1 ? 2,1 Машина ждет появления пустой клетки над кареткой. После очередного хода человека машина делает свой ход. Если человек видит всего одну метку на ленте, он прекращает игру, признав свое поражение 2^3 Эта серия команд выведет каретку на пятую (десятую, пятнадцатую и т. д.) позицию. Какой бы ход ни сделал соперник, в ней обязательно будет стоять метка 3^4 4^5 5^6 б 1 7 Стирается метка в текущей клетке 7^8 Шаг влево 8 ? 9,6 Если клетка не пустая, то возврат к команде 6 9 ^ 10 Каретка перемещается к первой помеченной клетке. После этого машина возвращается к команде 1 и ждет хода человека (или признания им своего поражения) 10 ? 9, 1 Подведем итог. Автоматическая обработка информации возможна, если: 1) информация представлена в формализованном виде — в конечном алфавите некоторой знаковой системы; 2) реализован исполнитель, обладающий конечной системой команд, достаточной для построения алгоритмов решения определенного класса задач обработки информации; 3) реализовано программное управление работой исполнителя. Машина Поста — пример автоматического исполнителя обработки информации с ограниченными возможностями. Компьютер удовлетворяет всем вышеперечисленным свойствам. Он является универсгшьным автоматическим исполнителем обработки информации. Задания 1. На информационной ленте машины Поста расположен массив из N меток. Каретка находится под крайней левой меткой. Какое состояние установится на ленте после выполнения следуюш;ей программы? 1^2 213 3^4 4? 5,2 5^6 6v7 71 54 Глава 2. Информационные процессы в системах 2. На информационной ленте на некотором расстоянии справа от каретки, стоящей под пустой клеткой, находится непрерывный массив меток. Требуется присоединить к правому концу массива одну метку. 3. На ленте расположен массив из 2п - 1 меток. Составить программу отыскания средней метки и стирания ее. 4. На ленте расположен массив из 2п меток. Составить программу, по которой машина раздвинет на расстояние в одну клетку две половины данного массива. Поиск данных Вспомните, как часто приходится вам искать какие-нибудь данные. Таких примеров много и в бытовых ситуациях, и в учебном процессе. Например, в программе телепередач вы ищете время начала трансляции футбольного матча; в расписании поездов — сведения о поезде, идущем до нужной вам станции. На уроке физики, решая задачу, ищете в таблице удельный вес меди. На уроке английского языка, читая иностранный текст, ищете в словаре перевод слова на русский язык. Работая за компьютером, вам нередко приходится искать на его дисках файлы с нужными данными или программами. Постановка задачи поиска данных Во всех компьютерных информационных системах поиск данных является основным видом обработки информации. При выполнении любого поиска данных имеются три составляющие, которые мы назовем атрибутами поиска: Первый атрибут: набор данных. Это вся совокупность данных, среди которых осуществляется поиск. Элементы набора данных будем называть записями. Запись может состоять из одного или нескольких полей. Например, запись в записной книжке состоит из полей: фамилия, адрес, телефон. Второй атрибут: ключ поиска. Это то поле записи, по значению которого происходит поиск. Например, поле ФАМИЛИЯ, если мы ищем номер телефона определенного человека. Третий атрибут: критерий поиска^ или условие поиска. Это то условие, которому должно удовлетворять значение ключа поиска в искомой записи. Например, если вы ищете телефон Сидорова, то критерий поиска заключается в совпадении фамилии Сидоров с фамилией, указанной в очередной записи в книжке. Заметим, что ключей поиска может быть несколько, тогда и критерий поиска будет сложным, учитывающим значения сразу нескольких ключей. Например, если в справочнике имеется несколько записей с фамилией Сидоров, но у них разные имена, то составной критерий поиска будет включать два условия: ФАМИЛИЯ — Сидоров, ИМЯ — Владимир. § 11. Поиск данных 55 Как при «ручном» поиске, так и при автоматизированном важнейшей задачей является сокраш;ение времени поиска. Оно зависит от двух обстоятельств: 1) как организован набор данных в информационном хранилиш;е (в словаре, в справочнике, на дисках компьютера и пр.); 2) каким алгоритмом поиска пользуется человек или компьютер. Организация набора данных Относительно первого пункта могут быть две ситуации: либо данные никак не организованы (такую ситуацию иногда называют «кучей»), либо данные структурированы. Под словами «данные структурированы» понимается наличие какой-то упорядоченности данных в их хранилище: в словаре, в расписании, в компьютерной базе данных. Говоря о системах в § 5, мы выделяли важнейшее свойство всякой системы — наличие структуры. Это свойство присуще как материальным системам, так и информационным системам. Названные выше примеры хранилищ информации, а также архивы, библиотеки, каталоги, журналы успеваемости учащихся и многие другие являются системами данных с определенной структурой. Структурированные системы данных, хранящиеся на каких-либо носителях, будем называть структурами данных. Однако бывает и так, что хранимая информация не систематизирована. Представьте себе, что вы записывали адреса и телефоны своих знакомых в записную книжку без алфавитного индекса («лесенки» из букв по краям листов). Записи вели в порядке поступления, а не в алфавитном порядке. А теперь вам нужно найти телефон определенного человека. Что остается делать? Просматривать всю книжку подряд, пока не попадется нужная запись! Хорошо, если повезет и запись окажется в начале книжки. А если в конце? И тут вы поймете, что книжка с алфавитом гораздо удобнее. Последовательный поиск Ситуацию, описанную выше, назовем поиском в неструктурированном наборе. Разумный алгоритм для такого поиска остается один: последовательный перебор всех элементов множества до нахождения нужного. Конечно, можно просматривать множество в случайном порядке (методом случайного перебора), но это может оказаться еще хуже, поскольку неизбежны повторные просмотры одних и тех же элементов, что только увеличит время поиска. Опишем алгоритм поиска методом последовательного перебора. Для описания алгоритма воспользуемся известным вам способом блок-схем (рис. 2.7). В алгоритме учтем два возможных варианта результата: 1) иско- 56 Глава 2. Информационные процессы в системах Рис. 2.7. Алгоритм поиска последовательным перебором мые данные найдены; и 2) искомые данные не найдены. Результаты поиска нередко оказываются отрицательными, если в наборе нет искомых данных. Символика блок-схем должна быть вам понятна. Из схемы видно, что если искомый элемент найден, то поиск может закончиться до окончания просмотра всего набора данных. Если же элемент не обнаружен, то поиск закончится только после просмотра всего набора данных. Зададимся вопросом: какое среднее число просмотров приходится выполнять при использовании метода последовательного перебора? Есть два крайних частных случая: • Искомый элемент оказался первым среди просматриваемых. Тогда просмотр всего один. • Искомый элемент оказался последним в порядке перебора. Тогда число просмотров равно N, где N — размер набора данных. То же будет, если элемент вообще не найден. Всякие средние величины принято определять по большому числу проведенных опытов. На этом принципе основана целая наука под названием математическая статистика. Нетрудно понять, что если число опытов (поисков) будет очень большим, то среднее число просмотров во всех этих опытах окажется приблизительно равным N/2. Эта величина определяет длительность поиска — главную характеристику процесса поиска. § 11. Поиск данных 57 Поиск ПОЛОВИННЫМ делением Возьмем для примера игру в угадывание целого числа в определенном диапазоне. Например, от 1 до 128. Один играющий загадывает число, второй пытается его угадать, задавая вопросы, на которые ответом может быть «да» или «нет». Ключом поиска в этом случае является число, а критерием поиска — совпадение числа, задуманного первым игроком, с числом, называемым вторым игроком. Если вопросы задавать такие: «Число равно единице?». Ответ: «Нет». Вопрос: «Число равно двум?» и т. д., то это будет последовательный перебор. Среднее число вопросов при многократном повторении игры с загадыванием разных чисел из данного диапазона будет равно 128/2 = 64. Однако поиск можно осуществить гораздо быстрее, если учесть упорядоченность натурального ряда чисел, благодаря чему между числами действуют отношения больше/меньше. С подобной ситуацией мы с вами уже встречались в § 4, говоря об измерении информации. Там обсуждался способ угадывания одного значения из четырех (пример с оценками за экзамен) и одного из восьми (пример с книжными полками). Применявшийся метод поиска называется методом половинного деления. Согласно этому методу, вопросы надо задавать так, чтобы каждый ответ уменьшал число неизвестных в два раза. Так же надо искать и одно число из 128. Первый вопрос: «Число меньше 65?» — «Да!» — «Число больше 32?» — «Нет!» и т. д. Любое число угадывается максимум за 7 вопросов. Это связано с тем, что 128 = 2^. Снова работает главная формула информатики. Метод половинного деления для упорядоченного набора данных работает гораздо быстрее (в среднем), чем метод последовательного перебора. На рис. 2.8 наглядно показан процесс поиска (угадывания) числа «3» из диапазона целых чисел от 1 до 8. ©©©0©©©0 f 1 X 2 3 4 ) 1-й вопрос ®® 2-й вопрос © 3-й вопрос Рис. 2.8. Выполнение поиска половинным делением Если максимальное число диапазона N не равно целой степени двойки, то оптимальное количество вопросов не будет постоянной величиной, а будет равно одному из двух значений: X или Х+1, где 2^ / Системный ) ^ информационная —W компьютерную ]—► информационная (реальная система) V анализ J модель N. форму J модель Рис. 3.1. Этапы разработки компьютерной информационной модели ным множеством различных свойств. Для создания его информационной модели требуется выделить лишь те свойства, которые необходимы с точки зрения цели моделирования; четко сформулировать эту цель необходимо до начала моделирования. Например, если вы хотите создать модель учебного процесса в вашем классе, то вам потребуются данные об изучаемых предметах, расписании занятий, оценках учеников, преподавателях. А если вы захотите смоделировать процесс летнего отдыха (например, коллективной поездки на юг), то вам потребуются совсем другие данные: сроки поездки, маршрут поезда, стоимость билетов, стоимость расходов на питание и пр. Возможно, что единственными общими данными для этих двух моделей будет список учеников класса. Система основных понятий Компьютерное информационное моделирование Модель — это объект-заменитель реального объекта Виды моделей: Материальные (натурные) модели Информационные модели Компьютерная информационная модель — модель, реализованная на компьютере Этапы построения компьютерной информационной модели: Определение цели моделирования Системный анализ объекта моделирования: результат — теоретическая информационная модель Реализация модели на компьютере: используется специальное программное обеспечение или языки высокого уровня Вопросы и задания 1. Что такое модель? Приведите примеры материальных моделей, не упомянутых в параграфе. 2. Что такое информационная модель? 70 Глава 3. Информационные модели 3. Можно ли карту города назвать информационной моделью? Обоснуйте ответ. 4. Почему многие научные знания можно отнести к информационным моделям? 5. Какова роль информатики в информационном моделировании? 6. В чем преимущество компьютерных информационных моделей перед теоретическими? 7. Какие данные вы бы включили в информационные модели следующих объектов и процессов: • обед в школьной столовой; • ремонт квартиры; • пассажир поезда; • дом, в котором вы живете? Структуры данных: деревья,сети, графы, таблицы Данные, используемые в любой информационной модели, всегда определенным образом упорядочены, структурированы. Иначе можно сказать так: данные, на которых базируется информационная модель, представляют собой систему со всеми характерными признаками — элементным составом, структурой, назначением. Такие структурированные системы данных часто называют структурами данных. Исследуя некоторую реальную систему (объект моделирования), системный аналитик строит ее теоретическую модель (см. рис. 3.1). При этом в первую очередь он должен описать структуру данных. Мы рассмотрим несколько часто используемых видов описания структур данных: графы, иерархические структуры (деревья) и таблицы. Г рафы Информация о некотором реальном объекте может быть представлена по-разному. В разговорной речи мы используем словесное (вербальное) представление информации. Вот, например, словесное описание некоторой местности: «Наш район состоит из пяти поселков: Дедкино, Бабкино, Репкино, Кошкино и Мышкино. Автомобильные дороги проложены между: Дедкино и Бабкино, Дедкино и Кошкино, Бабкино и Мышкино, Бабкино и Кошкино, Кошкино и Репкино». По такому описанию довольно трудно представить себе эту местность, нелегко и запомнить описание. А представьте себе, что поселков не 5, а 25! Всё гораздо понятнее становится из схемы на рис. 3.2 (на ней поселки обозначены первыми буквами своих названий). § 14. Структуры данных: деревья, сети, графы, таблицы 71 Это не карта местности. Здесь не выдержаны направления по сторонам света, не соблюден масштаб. На этой схеме отражен лишь факт существования пяти поселков и дорожной связи между ними. Такая схема называется графом. Граф отображает элементный состав системы и структуру связей. Составными частями графа являются вершины и ребра. Здесь вершины изображены кружками, обозначающими элементы системы, а ребра изображены линиями, показывающими связи (отношения) между элементами. Глядя на этот граф, легко понять структуру дорожной системы в данной местности. Построенный граф позволяет, например, ответить на вопрос: через какие поселки надо проехать, чтобы добраться из Репкино в Мышкино. Видно, что есть два возможных пути; обозначим их так: 1) Р —К —Б —М; 2) Р —К —Д —Б —М. Очевидно, первый путь более выгодный, потому что он короче. Однако если по какой-то причине дорога между К и Б окажется непроезжей (начнутся ремонтные работы или дорогу занесет снегом), то единственным остается второй путь. Граф на рис. 3.2 еще называют сетью. Для сети характерна возможность множества различных путей перемещения по ребрам между некоторыми парами вершин. Для сетей также характерно наличие замкнутых путей, которые называются циклами. На рис. 3.2 имеется цикл: К - Д - Б - К. Кстати, термин «дорожная сеть» используется и в разговорной речи. И чем такая сеть гуще, тем лучше для сообщения, поскольку появляется множество различных вариантов проезда. Граф, изображенный на рис.3.2, является неориентированным графом. На нем каждое ребро обозначает наличие дорожной связи между двумя пунктами. Но дорожная связь действует одинаково в обе стороны: если по дороге можно проехать от Б к М, то по ней же можно проехать и от М к Б. Такую связь еще называют симметричной. А теперь рассмотрим другой пример графа — на рис. 3.3. Этот пример относится к медицине. Известно, что существуют четыре группы крови человека. Оказывается, что при переливании крови от одного человека к другому не все группы совместимы. Граф на рис. 3.3 показы- 72 Глава 3. Информационные модели вает возможные варианты переливания крови. Группы крови обозначены вершинами графа с соответствуюш;ими номерами, а стрелки указывают на возможность переливания одной группы крови человеку с другой группой крови. Например, из этого графа видно, что кровь I группы можно переливать любому человеку, а человек с I группой крови воспринимает только кровь своей группы. Видно также, что человеку с IV группой крови можно переливать любую кровь, но его собственную кровь можно переливать только человеку с той же группой. Связи между вершинами данного графа несимметричны и поэтому изображаются направленными линиями со стрелками. Такие линии принято называть дугами (в отличие от ребер неориентированных графов). Граф с такими свойствами называется ориентированным. Линия, выходящая и входящая в одну и ту же вершину, называется петлей. На рис. 3.3 присутствуют четыре такие петли. Нетрудно понять преимущества изображения системы переливания крови в виде графа по сравнению с вербальным (словесным) описанием тех же самых правил. Граф на рис. 3.3 легко воспринимается и запоминается. Иерархические структуры (деревья) При построении информационных моделей многих систем приходится иметь дело с иерархической структурой. Как правило, иерархическую структуру имеют системы административного управления, между элементами которых установлены отношения подчиненности. Например: директор завода — начальники цехов — начальники участков — бригадиры — рабочие. Иерархическую структуру имеют также системы, между элементами которых существуют отношения вхождения одних в другие. На рис. 3.4 изображен граф, отражающий иерархическую административную структуру нашего государства: Российская Федерация делится на семь административных округов; округа делятся на регионы (области и национальные республики), в состав которых входят города и другие населенные пункты. Такой граф называется деревом. Основным свойством дерева является то, что между любыми двумя его вершинами существует единственный путь. Деревья не содержат циклов и петель. Рис. 3.4. Граф иерархической системы (административная структура Российской Федерации) Обычно у дерева, отображающего иерархическую систему, выделяется одна главная вершина, которая называется корнем дерева. Эта вершина изображается вверху; от нее идут ветви дерева. От корня начинается отсчет уровней дерева. Вершины, непосредственно связанные с корнем, образуют первый уровень. От них идут связи к вершинам второго уровня и т. д. Каждая вершина дерева (кроме корня) имеет одну исходную вершину на предыдущем уровне и может иметь множество порожденных вершин на следующем уровне. Такой принцип связи называется «один ко многим», в отличие от сети — там связь «многие ко многим». Вершины, которые не имеют порожденных вершин, называются листьями. На рис. 3.4 вершины, обозначающие города, являются листьями. Иерархическими являются различные системы классификации в науке. Например, в биологии весь животный мир Земли рассматривается как система, которая делится на типы животных, типы делятся на классы, классы состоят из отрядов, отряды — из семейств, семейства делятся на роды, роды — на виды. Следовательно, система животных имеет шестиуровневую иерархическую структуру. При изучении информатики вам не однажды приходилось встречаться с иерархическими системами. Например, система хранения файлов на магнитных дисках организована по иерархическому принципу. Операционная система позволяет получить на экране компьютера изображение файловой структуры в виде дерева (рис. 3.5). Корнем этого дерева является корневой каталог диска, вершинами — подкаталоги разных уровней. Как известно, путь к файлу — это путь от корневого каталога до каталога, непосредственно содержащего данный файл. И для каждого файла такой путь единственный. Например, путь к файлам, содержащимся в каталоге Images на рис.3.5, описывается так; \Inform\hyperbase\6.11\Images 74 Глава 3. Информациониые модели System (С;) Chess б а Icf Й-Ш Classic Volumes В а Inform h-a common 6 -ia hjfperbase В-Ш 6.11 Ш a Dll I a Images ^ a M achine ба projects 6-a lexicon Рис. 3.5. Иерархическая система хранения файлов При поиске информации в дереве перемещение по нему может происходить только вверх или вниз (на уровень выше или на уровень ниже). Нельзя осуществить прямой переход между вершинами одного уровня. Еще одним примером иерархической структуры является система доменных адресов в Интернете. Фрагмент этой системы представлен на рис. 3.6 в виде дерева. Рис. 3.6. Иерархическая структура доменных адресов в Интернете В этом дереве от корня отходят домены первого уровня, затем — второго и т. д. Овалами изображены компьютеры. Адрес компьютера включает в себя последовательность доменов и имя компьютера (сначала записывается имя компьютера, затем домен нижнего уровня и т. д., до домена само- § 14. Структуры данных: деревья, сети, графы, таблицы 75 ГО верхнего уровня). Для трех указанных на рис. 3.6 компьютеров доменные адреса записываются так: www.pstu.ac.ru hidra.psu.ru mail.psu.ru Каждую вершину дерева, не являющуюся листом, можно рассматривать как корень поддерева, исходящего из этой вершины. Например, на рис. 3.6 поддерево с корнем в вершине г и представляет структуру доменных имен российского сектора Интернета. Таблицы Представление информации в табличной форме широко распространено. Только в школьной практике вам приходится встречаться с массой таблиц: расписанием занятий, журналом успеваемости, графиком дежурств, таблицей Менделеева, таблицами физических свойств веществ (плотности, теплоемкости, электрического сопротивления и пр.), таблицами исторических дат и многими другими. Чаще всего мы пользуемся прямоугольными таблицами (бывают и более «хитрые» формы таблиц, но о них мы говорить не будем). Простейшая таблица состоит из строк и граф (столбцов). В верхней строке таблицы обычно располагаются заголовки столбцов. Пересечение строки и столбца образует ячейку. Таблица 3.1 — пример прямоугольной таблицы, содержащей сведения о погоде в течение нескольких дней. Таблица 3.1. Погода Дата Осадки Температура, °С Давление, мм рт. ст. Влажность, % 15.03.2007 снег -3,5 746 67 16.03.2007 без осадков 0 750 62 17.03.2007 туман 1,0 740 100 18.03.2007 дождь 3,4 745 96 19.03.2007 без осадков 5,2 760 87 Обратите внимание на правила оформления таблиц. Над таблицей обычно указывается ее номер и заголовок. Заголовки столбцов пишутся с прописной буквы; там, где это необходимо, указываются размерности величин. Таблица 3.1 является примером таблицы типа «объект—свойство». Каждая строка такой таблицы относится к конкретному объекту. В нашем примере объект — это определенный день. Первый столбец обычно идентифицирует этот объект (дата идентифицирует день). Последующие графы отражают свойства объекта. В таблице 3.1 это метеорологические данные. Обратите внимание на то, что строки таблицы расположены по возрастанию даты, т. е. информация в таблице упорядочена (по дате). Упорядоченность позволяет быстро найти нужные данные. 76 Глава 3. Информационные модели Другой ТИП таблиц называется «объект—объект». Такие таблицы отражают взаимосвязь между различными объектами. Примером является таблица успеваемости учеников по разным предметам (табл. 3.2). Таблица 3.2. Успеваемость Ученик Предмет Русский Алгебра Химия Физика История Музыка Аликин Петр 4 5 5 4 4 5 Ботов Иван 3 3 3 3 3 4 Волков Илья 5 5 5 5 5 5 Галкина Нина 4 4 5 2 4 4 Эта таблица отражает связь между объектами двух типов: учениками и изучаемыми дисциплинами. Оценка (расположена в ячейке) является характеристикой такой связи. В такой таблице строки и столбцы могут поменяться местами: в строках — информация о предметах, в столбцах — об учениках. Удобнее работать с таблицами, в которых столбцов меньше, чем строк. Обычно учеников в классе больше, чем изучаемых предметов. Важной разновидностью таблиц типа «объект-объект» являются двоичные матрицы. Двоичные матрицы отображают качественную связь между объектами: есть связь или нет связи. Например, если бы ученики могли выбирать изучаемые предметы по своему усмотрению, то сведения о том, кто что изучает, можно было бы представить в виде таблицы 3.3: Таблица 3.3. Изучаемые предметы Ученик Предмет Русский Алгебра Химия Физика История Музыка Аликин Петр 0 1 1 1 0 0 Ботов Иван 1 1 0 1 0 1 Волков Илья 1 0 0 0 1 1 Галкина Нина 0 1 1 0 1 0 Нетрудно догадаться, что единица указывает на изучаемый предмет, а неизучаемый предмет отмечен нулем. Табличный способ представления данных является универсальным. Любую структуру данных, в том числе и представленную в форме графа, можно свести к табличной форме. Таблица 3.4 — возможное представление иерархической структуры, изображенной на рис. 3.2. § 14. Структуры данных: деревья, сети, графы, таблицы 77 Таблица 3.4. Административная структура Российской Федерации Город Регион Округ Березники Пермская обл. Приволжский Екатеринбург Свердловская обл. Уральский Кунгур Пермская обл. Приволжский Пермь Пермская обл. Приволжский Сергиев Посад Московская обл. Центральный Заполнение таблицы происходит путем движения по дереву снизу вверх (от листьев к корню). Получилась таблица типа «объект-свойство». Объекты — города, а свойствами является их принадлежность к соответствующим административно-географическим зонам. Строки в данной таблице упорядочены в алфавитной последовательности названий городов. Число граф в таблице равно числу уровней в дереве. Нет смысла заводить графу под названием «Государство», поскольку во всех строках в ней будет присутствовать одно значение «Российская Федерация». Лучше это слово вынести в заголовок таблицы. Для табличного представления сетей используют двоичные матрицы. Таблица 3.5 представляет собой двоичную матрицу, соответствующую структуре сети на рис. 3.2. Таблица 3.5. Дорожная сеть Поселок Поселок Бабкино Дедкино Кошкино Репкино Мышкино Бабкино 0 1 1 0 1 Дедкино 1 0 1 0 0 Кошкино 1 1 0 1 0 Репкино 0 0 1 0 0 Мышкино 1 0 0 0 0 Двоичная матрица в этой таблице называется матрицей смежности: единицы стоят на пересечении строк и столбцов с названиями смежных (соединенных дорогой) поселков. Если сеть является неориентированным графом, то матрица смежности симметрична относительно главной диагонали, идущей от верхнего левого угла в правый нижний угол матрицы (подумайте сами почему). Вследствие этого, если строки и столбцы поменять местами, то матрица не изменится. Замечание: вопрос о том, какую цифру (ноль или единицу) ставить в диагональных клетках, носит условный характер. Можно договориться по-разному. В таблице 3.5 поставлены нули из тех соображений, что, например, дороги Бабкино-Бабкино не существует (хотя, в принципе, можно построить такую петлю). 78 Глава 3. Информационные модели У матрицы, отражающей ориентированный граф, такой симметричности не будет. В этом случае надо договориться о смысле строк и столбцов. Например, пусть для каждой пары смежных вершин строка обозначает начальную, а столбец — конечную вершину. Тогда структуру ориентированного графа, изображенного на рис. 3.3, можно представить следующей двоичной матрицей смежности — табл. 3.6. Таблица 3.6. Переливание крови Начальная вершина Конечная вершина I II III IV I 1 1 1 1 II 0 1 0 1 III 0 0 1 1 IV 0 0 0 1 Может возникнуть вопрос: зачем мы переводили графы в табличную форму? Ведь граф, с точки зрения человека, гораздо нагляднее и понятнее представляет структуру системы, чем таблица. Для человека это действительно так. Однако для компьютерной обработки табличная форма подходит лучше. Многие компьютерные технологии работают с таблицами (базы данных, электронные таблицы); обработку таблиц удобно описывать на универсальных языках программирования. Поэтому представление системы в форме графа обычно используется в теоретических моделях, а в компьютерном моделировании чаще работают с табличным представлением. Система основных понятий Структуры данных Графы Таблицы Разновидности графа Элементы прямоугольной таблицы Деревья Сети Строки Столбцы Ячейки Тип связей в графе Типы таблиц Один ко многим Многие ко многим Элементы дерева Элементы сети Объект- свойство Объект- объект Двоичная матрица Корень Ветви Листья Вершины Ребра Единственность пути между вершинами Множественность путей между вершинами § 14. Структуры данных: деревья, сети, графы, таблицы 79 Вопросы и задания 1. Что такое граф? Из чего он состоит? 2. Какой граф называется неориентированным? 3. Что такое сеть? Какие характерные особенности имеет сеть? 4. Какой граф называется ориентированным? Приведите примеры. 5. Дайте имена возможным связям между следующими объектами и изобразите связи между ними в форме графа: брат и сестра; ученик и школа; Саша и Маша; Москва и Берлин; министр, директор, рабочий; Пушкин и Дантес; Европа, Франция, Париж. 6. Изобразите в виде графа систему, состоящую из четырех одноклассников, между которыми существуют следующие связи (взаимоотношения): дружат: Саша и Маша, Саша и Даша, Маша и Гриша, Гриша и Саша. Глядя на полученный граф, ответьте на вопрос: с кем Саша может поделиться секретом, не рискуя, что он станет известен кому-то другому? 7. Нарисуйте два варианта графа системы «Компьютер», содержащего следующие вершины: процессор, оперативная память, внешняя память, клавиатура, монитор, принтер; а) линия связи обозначает отношение «передает информацию»; б) линия связи обозначает отношение «управляет». 8. Граф с какими свойствами называют деревом? Что такое корень дерева, ветви, листья? 9. Какие системы называют иерархическими? 10. Постройте граф структуры управления вашей школой. Оказался ли он деревом? Если да, то что находится в корне этого дерева? Что является листьями? 11. Откройте страницу с содержанием данного учебника. Изобразите структуру этого содержания в виде дерева. 12. В чем состоит удобство табличного представления информации? 13. Придумайте свои примеры таблиц типа «объект-свойство» и «объект-объект». 14. Что такое двоичная матрица? Какую информацию она в себе содержит? 15. Нарисуйте произвольную структуру глобальной компьютерной сети в виде графа, в котором вершины обозначают серверы, а ребра — линии связи. Опишите эту сеть в виде двоичной матрицы смежности. 16. Двоичные матрицы удобно использовать для решения некоторых логических задач — головоломок. Попробуйте таким путем решить следующие задачи. 1) Имена Иванова, Петрова, Семенова и Николаева — Иван, Петр, Семен и Николай, причем только у Николаева имя совпадает с фамилией, т. е. его зовут Николай. Семенова зовут не Петром. Определить фамилию и имя каждого человека. 2) В Норильске, Москве, Ростове и Пятигорске живут четыре супружеские пары, причем в каждом городе — только одна пара. Имена этих супругов: Антон, Борис, Давид, Григорий, Ольга, Мария, Светлана, Екатерина. Антон живет в Норильске, Борис и Ольга — супруги, Григорий и Светлана не живут в одном городе, Мария живет в Москве, Светлана — ростовчанка. Кто на ком женат и кто где живет? 17. Нарисуйте родословное дерево своей семьи (только по мужской или только по женской линии) с наибольшим числом известных вам уровней. Полученное дерево приведите к табличной форме. В полях, значения которых неизвестны, поставьте прочерки. 80 Глава 3. Информационные модели Пример структуры данных — модели предметной области Разберем пример на построение структуры данных, являющейся информационной моделью реальной системы. В качестве объекта моделирования (реальной системы) выберем процесс приема в высшее учебное заведение. Пусть это будет университет. Построение модели начинается с системного анализа предметной области. В данном случае предметной областью является работа приемной комиссии университета. Представим себя в роли системных аналитиков и начнем работу. Поставленная нами задача является непростой. Процесс приема в университет проходит через несколько стадий. Опишем их. 1. Подготовительный этап: предоставление информации о вузе, его факультетах для принятия решения молодыми людьми о поступлении на конкретный факультет, на конкретную специальность. 2. Прием документов от абитуриентов, оформление документации. 3. Сдача абитуриентами приемных экзаменов, обработка результатов экзаменов. 4. Процедура зачисления в университет по результатам экзаменов. Все эти этапы связаны с получением, хранением, обработкой и передачей информации, т. е. с осуществлением информационных процессов. На подготовительном этапе от нашей информационной модели в первую очередь потребуются сведения о плане приема в университет: на каких факультетах, кгисие специальности открыты для поступления; сколько человек принимается на каждую специальность. Кроме того, абитуриентов (и их родителей) интересует: какие вступительные экзамены сдаются на каждом факультете, какие засчитываются по результатам ЕГЭ. Кротов) ( Анохин ) ( Волков) ( Дирк^ (Яншина) ( Кузин )(Лядова Рис. 3.7. Иерархия данных об университете и абитуриентах § 15. Пример структуры данных — модели предметной области 81 На втором этапе приемная комиссия будет получать и обрабатывать информацию, поступающую от абитуриентов, подающих заявления в университет. На третьем этапе приемная комиссия будет заносить в информационную базу результаты вступительных экзаменов (или ЕГЭ) для каждого поступающего. Наконец, на четвертом этапе в систему вносятся окончательные результаты приема: сведения для каждого абитуриента о том, поступил он в университет или нет. Все данные, о которых говорилось выше, могут быть объединены в трехуровневую иерархическую структуру, представленную в виде графа на рис. 3.7. За каждой из вершин этого графа кроется совокупность данных по каждому из названных (записанных в овале) объектов. Эти совокупности данных сведем к таблицам, т. е. получим структуру данных в форме табличной модели. Для каждого уровня дерева 3.7 создается таблица своего типа. Вот как выглядят таблицы для уровней факультетов и специальностей (табл. 3.7 и 3.8). Таблица 3.7. Факультеты Название факультета Экзамен 1 Экзамен 2 Экзамен 3 экономический математика география русский язык исторический история Отечества иностранный язык сочинение юридический русский язык иностранный язык обществознание ... ... ... Таблица 3.8. Специальности Название специальности Название факультета План приема финансы и кредит экономический 25 бухгалтерский учет экономический 40 история исторический 50 политология исторический 25 юриспруденция юридический 60 социальная работа юридический 25 ... ... Таблицы 3.7 и 3.8 представляют собой экземпляры таблиц ФАКУЛЬТЕТЫ и СПЕЦИАЛЬНОСТИ. При описании структуры таблицы достаточно указать ее имя и перечислить заголовки всех столбцов. 82 Глава 3. Информационные модели ФАКУЛЬТЕТЫ СПЕЦИАЛЬНОСТИ Название факультета Название специальности Экзамен 1 Название факультета Экзамен 2 План приема Экзамен 3 Третий уровень дерева начинает формироваться на втором этапе работы приемной комиссии. В это время абитуриенты пишут заявления о допуске к поступлению, сдают необходимые документы (копии паспорта, школьного аттестата и др.), заполняют анкету. Каждому абитуриенту присваивается его личный идентификатор — номер регистрации. Далее под этим номером он будет фигурировать во всех документах. На каждого абитуриента готовится анкета, куда заносятся его исходные данные (фамилия, имя, отчество, дата рождения и другие сведения, нужные приемной комиссии), сведения о факультете и специальности, на которую он поступает. В процессе сдачи экзаменов (на третьем этапе) в анкету будут заноситься полученные оценки. Последней записью в анкете будет запись «зачислен» или «не зачислен». Всю таблицу с перечисленными данными назовем АБИТУРИЕНТЫ. АБИТУРИЕНТЫ Регистрационный номер Фамилия Имя Отчество Дата рождения Город Законченное учебное заведение Название специальности Производственный стаж Медаль Оценка за экзамен 1 Оценка за экзамен 2 Оценка за экзамен 3 Зачисление § 15. Пример структуры данных — модели предметной области 83 У вас может возникнуть вопрос: как в трех полученных таблицах отражена связь между ними, которая явно обозначена на графе рис. 3.7? Такая связь между таблицами существует за счет имеющихся в них общих (совпадающих) полей. В таблицах ФАКУЛЬТЕТЫ и СПЕЦИАЛЬНОСТИ есть общее поле «Название факультета». В таблицах СПЕЦИАЛЬНОСТИ и АБИТУРИЕНТЫ общим полем является «Название специальности». Благодаря этому всегда можно понять, на какую специальность поступает данный абитуриент, а через информацию о специальности можно узнать, на какой факультет он поступает. Здесь предполагается, что названия специальностей на разных факультетах не повторяются, как это и принято в вузах. Подведем итог: нами построена структура данных, состоящая из трех взаимосвязанных таблиц, являющаяся табличной формой информационной модели предметной области «Приемная кампания в университете». Система основных понятий Построение структурной модели Определение предметной области моделирования: работа приемной комиссии университета Описание иерархической структуры данных: выделены три уровня иерархии: факультеты, специальности, абитуриенты — три типа объектов модели Определение необходимого набора параметров (свойств, атрибутов) для каждого типа объектов Описание таблиц для всех типов объектов Организация связей между таблицами: обеспечение наличия совпадающих полей в таблицах Вопросы и задания 1. а) Перечислите задачи, которые должна решать проектируемая информационная модель приемной кампании в университет. б) Какая информация представляется важной при приеме в вуз с точки зрения поступающего? С точки зрения вуза? 2. Разработайте по аналогии информационную модель «Школа». Модель должна быть представлена в графической и табличной формах. 84 Глава 3. Информационные модели Алгоритм как модель деятельности Снова вернемся к понятию алгоритма, которое обсуждалось в § 9. Однако теперь будем анализировать понятие алгоритма с новой точки зрения. В науке о моделировании среди многих видов информационных моделей называются и алгоритмические модели. Что такое алгоритмическая модель Попробуем разобраться, почему алгоритм можно назвать моделью и что он моделирует. Как вам известно, алгоритм — это понятное и точное предписание конкретному исполнителю совершить конечную последовательность действий, приводящую к поставленной цели. Из определения следует, что поставленная цель достигается через деятельность (последовательность действий) некоторого исполнителя. Этапы деятельности от определения цели (постановки задачи) до получения результата такие: 1) определение цели; 2) планирование работы исполнителя; 3) работа исполнителя; 3) получение результата. Где же здесь место алгоритму? Алгоритм — это детальный план работы исполнителя, это описание последовательности элементарных действий, которые должен совершить исполнитель. Но всякий план или описание есть информационная модель. Следовательно: Алгоритм является информационной моделью деятельности исполнителя. Такую модель будем называть алгоритмической. В схематическом виде четыре описанных этапа представлены на рис. 3.8. Рис. 3.8. Этапы движения от цели к результату § 16. Алгоритм как модель деятельности 85 Чтобы построить реальный план-алгоритм, который окажется выполнимым, нужно точно знать возможности исполнителя. Эти возможности определяются системой команд исполнителя (СКИ). Составляя алгоритм, нельзя выходить за рамки СКИ. В этом состоит свойство понятности алгоритма. Оказывается, гораздо проще построить алгоритм для программно управляемого автомата (в том числе компьютера), чем для человека. Для автомата СКИ — это строго определенный конечный набор команд, заложенный в него конструкторами. Поэтому алгоритм представляет собой точное описание его работы, и автомат выполняет работу, формально следуя указаниям алгоритма. Для управления автоматом или компьютером нетрудно придумать формализованный язык описания алгоритмов. Такие языки называются языками программирования, а алгоритм, представленный на языке программирования, называется программой. Сложнее дело обстоит с человеком, которого трудно назвать формальным исполнителем. И что совершенно очевидно, СКИ человека невозможно полностью описать. Пример алгоритмической модели Обсудим описанные выше проблемы на конкретном примере. Вернемся к задаче, которую рассматривали в § 11, — угадывание целого числа из заданного диапазона методом половинного деления. Напомним постановку задачи. Первый игрок загадывает целое число из заданного диапазона чисел, например от 1 до 100. Второй должен угадать это число за наименьшее количество вопросов. Запишем алгоритм угадывания числа методом половинного деления, ориентированный на исполнителя-человека. АлрориФм Угадывание числа Дано; диапазон чисел от А до В Надо: угадать число X, задуманное игроком, используя алгоритм половинного деления Начало 1. Задать вопрос: X меньше среднего значения между А и В? 2. Если ответ "да", то принять за значение В целую часть среднего значения 3. Если ответ "нет", то принять за значение А ближайшее целое число, большее, чем среднее 4 . Если значения А и В равны, то их общее значение и есть ис- комое число X 5 . Если значения А и В не равны, то вернуться к выполнению пунк- та 1 Конец Насколько многословен этот алгоритм! И еще нет уверенности, что исполнитель «Вася из 8Б» правильно выполнит все его пункты, хотя образование восьмиклассника должно это ему позволять. В этом примере использовано словесное описание алгоритма. Данный алгоритм ориентирован на исполнителя-человека, а не на компьютер. По- 86 Глава 3. Информационные модели этому здесь нет никаких вводов, присваиваний, выводов и прочих формальных команд компьютерного алгоритма. Как уже отмечено выше, один человек его сможет исполнить, а другой — нет. Алгоритм, составленный для компьютера и переведенный на язык программирования, будет точно исполнен любым компьютером, «понимаю-ш;им)> этот язык. На рис. 3.9 приведен алгоритм поиска числа методом половинного деления для исполнителя-компьютера в форме блок-схемы и на учебном алгоритмическом языке, знакомом вам из базового курса информатики. {Примечание. ЦЕЛ обозначает функцию выделения целой части аргумента.) Рис. 3.9. Алгоритм «Половинное деление» Напомним основные правила изображения блок-схем. Блок-схема — это ориентированный граф, указывающий порядок исполнения команд алгоритма исполнителем. Блоки — вершины этого графа — обозначают отдельные команды, которые отдаются исполнителю, а дуги указывают на последовательность переходов от одной команды к другой. В прямоугольниках на блок-схемах записываются команды — действия, в ромбах — условия, определяющие направление дальнейшего исполнения команд; в параллелограммах — команды ввода или вывода информации; в овалах — начало или конец исполнения алгоритма. Здесь можно говорить о пути прохождения графа в ходе выполнения алгоритма. Любой путь начинается от вершины «Начало» и заканчивается выходом на вершину «Конец». Внутри же путь может быть разным в зависимости от исходных данных и от результатов проверки условий. § 16. Алгоритм как модель деятельности 87 Блок-схема и алгоритмический язык — это две разные формы представления алгоритмической модели. Блок-схема — графическая форма, алгоритмический язык — текстовая форма. Блок-схема обладает большей наглядностью, на ней легче увидеть структуру алгоритма. Алгоритмический язык ближе по форме к языкам программирования. От записи алгоритма на алгоритмическом языке легко перейти к записи программы на языке программирования. Структура построенного алгоритма — цикл с вложенным ветвлением. Из базового курса информатики вам должно быть известно, что любой алгоритм можно построить из сочетания трех основных алгоритмических структур: следования^ ветвления и цикла. Это утверждение — основа методики, которая называется структурным программированием. Современные языки программирования позволяют легко переходить от описания алгоритма к программе, если алгоритм построен структурно. Поэтому наиболее рациональной моделью деятельности исполнителя является структурная алгоритмическая модель. Не составит большого труда запрограммировать описанный выше алгоритм на каком-нибудь языке программирования, например на Паскале или Бейсике. Трассировка алгоритма — модель работы процессора Для того чтобы проверить правильность алгоритма, изображенного на рис. 3.9, совсем не обязательно переводить его на язык программирования и выполнять тесты на компьютере. Протестировать алгоритм может и человек — путем трассировки. Выполняя ручную трассировку, человек моделирует работу процессора, исполняя каждую команду алгоритма и занося результаты выполнения команд в трассировочную таблицу. В базовом курсе вы этим уже занимались. Построим трассировочную таблицу для алгоритма «Половинное деление». Выберем интервал угадываемых чисел от 1 до 8. Пусть игрок задумал число 3. Проверим, как по данному алгоритму будет получено это число. Трассировочная таблица алгоритма «Половинное деление» № шага Команда алгоритма Переменные Выполняемые действия X А В 1 Ввод А, В, X 3 1 8 2 А Ф В 1 8, да 3 X < (А+В)/2 3 < 4,5, да 4 В:=ЦЕЛ((А+В)/2) 4 В;=4 5 А Ф В 1 4, да 6 X < (А+В)/2 3 < 2,5, нет см. продолжение 88 Глава 3. Информационные модели Продолжение таблицы 7 А:=ЦЕЛ((А+В)/2)+1 3 А:=3 8 А Ф Ъ 3^4, да 9 X < (А+В)/2 3 < 3,5, да 10 В:=ЦЕЛ((А+В)/2) 3 В:=3 11 А Ф В 3 3, нет 12 Вывод А Ответ: 3 Трассировочная таблица является моделью работы процессора при выполнении программы. Программа выполняется по шагам (первый столбец таблицы). В столбце «Команда алгоритма» отображается содержимое регистра команд процессора, куда помещается очередная команда. В столбце «Переменные» отображается содержимое ячеек памяти компьютера (или регистров памяти процессора), отведенных под переменные величины. В графе «Выполняемое действие» отражаются действия, выполняемые арифметико-логическим устройством процессора. Таким образом, гшгоритм в совокупности с трассировочной таблицей полностью моделируют процесс обработки информации, происходящий в компьютере. Система основных понятий Алгоритм — модель деятельности Объект моделирования — целенаправленная деятельность исполнителя Исполнитель-человек Исполнитель-автомат (в том числе компьютер) Неформализованная СКИ Формализованная СКИ Формы представления алгоритмов Блок-схема Учебный алгоритмический язык Язык программирования Трассировка алгоритма — пошаговое исполнение алгоритма с тестовым вариантом исходных данных «Ручная* трассировка — заполнение трассировочной таблицы Трассировочная таблица — модель работы процессора при исполнении алгоритма § 16. Алгоритм как модель деятельности 89 Вопросы и задания 1. Почему алгоритм можно назвать моделью деятельности? 2. Почему алгоритм является информационной моделью? 3. Попробуйте описать собственную конечную СКИ в рамках какого-то частного вида вашей деятельности (посеш;ение школы, отдых, общение с людьми). 4. Опишите систему команд какого-нибудь известного вам бытового автомата, например стиральной машины, кухонного комбайна и пр. 5. Почему компьютер называют формальным исполнителем? 6. Придумайте какие-нибудь новые формы представления алгоритмов, кроме тех, что описаны в параграфе. 7. Что моделирует трассировочная таблица? 8. В § 9 описан алгоритм нахождения наибольшего общего делителя (алгоритм Евклида), ориентированный на исполнителя-человека. Представьте его в виде блок-схемы и на алгоритмическом языке для исполнителя-компьютера. 9. Выполнив предыдущее задание, проведите трассировку алгоритма Евклида для нахождения НОД чисел 128 и 56. 10. Нарисуйте ориентированный граф (блок-схему) проверки учителем пачки тетрадей. В систему команд входит: проверить работу, взять тетрадь из пачки', выставить оценку, выяснить, остались ли еш,е не проверенные тетради. Содержит ли полученный граф цикл? 11. Нарисуйте блок-схему алгоритма поиска фальшивой монеты среди десяти монет. В вашем распоряжении имеются лабораторные весы (с двумя чашечками) без гирь. Известно, что фальшивая монета всего одна, и она легче настоящих. 90 Глава 3. Информационные модели К итогам главы 3 Этапы информационного моделирования Выбор Объектом моделирования может быть объекта любой реальный объект моделирования (любая реальная система) Определение цели моделирования Системный анализ объекта моделирования Построение теоретической информационной модели Цель моделирования определяется характером использования будущей модели Основные понятия системологии: • система, подсистема • структура (в том числе иерархическая, сетевая) • типы связей (отношений) • системный подход • системы управления, самоуправляющиеся системы__________________________________ Способы представления информационных моделей: • таблица • граф: сеть, дерево • математическая формула, уравнение __________________________________________ Средства разработки компьютерных моделей: Создание компьютерной • СУБД • табличные процессоры модели • языки программирования • универсальные и специализированные Использование компьютерной модели Глава 4________________________ Программно-технические системы реализации информационных процессов Компьютер — универсальная техническая система обработки информации Появление компьютеров полностью изменило все существовавшие до того приемы и методы обработки информации. Впервые человек обрел техническое устройство, которое в той же мере автоматизировало и облегчило процессы обработки информации, в какой в результате технических революций облегчились процессы обработки материальных объектов. Архитектура персонального компьютера С устройством компьютера вы в общих чертах уже знакомы и готовы к тому, чтобы обсудить архитектуру современного персонального компьютера (ПК), изображенную на рис. 4.1. Напомним, что архитектура — это наиболее общие принципы построения компьютера, отражающие программное управление работой и взаимодействием его основных функциональных узлов. -- данных---- Шина -- адреса------ -- управления Рис. 4.1. Архитектура персонального компьютера (сплошные линии означают потоки данных, пунктирные — управляюш;ие сигналы, К — контроллер) 92 Глава 4. Программно-технические системы реализации информационных процессов Если сравнить эту схему с классической, изображенной на рис. 4.2 (архитектурой фон Неймана, или «неймановской» по имени автора), архитектурой ЭВМ первых поколений, то видны следующие принципиальные различия: • вместо процессора имеем центральный процессор; • вместо одного устройства ввода информации имеем группу устройств неопределенного состава (аналогично и для устройств вывода); • появились новые элементы архитектуры, такие как видеопамять, шина, контроллер. Рис. 4.2. Архитектура компьютеров первых поколений (фон Неймана) Для понимания некоторых особенностей архитектуры ПК отметим следующее. Основные устройства компьютеров тех поколений, которые предшествовали ПК, были реализованы на качественно иных электронных элементах. Вся эволюция компьютеров шла и идет под знаком миниатюризации электронных схем, что не просто способствовало уменьшению размеров базовых узлов компьютера, но и привело к огромному, в десятки тысяч раз, росту быстродействия процессора. Возникло существенное противоречие между высокой скоростью обработки информации внутри машины и медленной работой устройств ввода/вывода, в большинстве своем содержащих механически движущиеся части. Необходимо было решить эту проблему, так как иначе процессор, руководивший работой внешних устройств, значительную часть времени был бы вынужден простаивать в ожидании информации «из внещнего мира», что существенно снижало бы эффективность работы всего компьютера в целом. Учеными и конструкторами был предложен такой путь: центральный процессор, который до этого осуществлял все функции по обмену данными между устройствами, освобождается от них, и эти функции передаются специальным электронным устройствам, так называемым контроллерам. § 17. Компьютер — универсальная техническая система обработки информации 93 Назначение контроллеров и шины Контроллер — это специализированный процессор, управляющий работой вверенного ему внешнего устройства. Например, контроллер накопителя на магнитных дисках (дисковода) «умеет» позиционировать головку на нужную дорожку диска, читать или записывать сектор, форматировать дорожку ИТ. п. И поскольку в системе появилось теперь несколько процессоров, главный из них для отличия стали называть центральным. Наличие контроллеров существенно изменяет процессы обмена информацией внутри компьютера. Центргшьный процессор при необходимости произвести обмен выдает задание на его осуществление контроллеру. Дальнейший обмен информацией может протекать под руководством контроллера без участия центргшьного процессора, который получает возможность выполнять программу дальше. Если же по данной задаче до завершения обмена ничего сделать нельзя, то можно в это время решать другую задачу. Из рис. 4.1 видно, что, в отличие от первоначальной архитектуры, для связи между отдельными функциональными узлами компьютера используется специальное устройство — шина. Шина состоит из трех частей: • шины данных (для передачи данных); • шины адреса (для передачи адресов); • шины управления (для передачи управляющих сигналов). Одно из достоинств описанной схемы заключается в возможности легко подключать к компьютеру новые устройства. Это называется принципом открытой архитектуры. Для пользователя открытая архитектура означает возможность свободно выбирать состав внешних устройств для своего компьютера в зависимости от круга решаемых задач. Виды памяти Память компьютера делится на внутреннюю — оперативную и внешнюю — долговременную. Основные различия внутренней и внешней памяти состоят в следующем: внутренняя память энергозависимая и «быстрая» , внешняя память энергонезависимая и сравнительно «медленная ». Чем определяется быстродействие памяти? Временем доступа процессора к данным, хранящимся в устройстве памяти. Иначе говоря, тем, за какое время процессор считывает или записывает в память фиксированную порцию данных, например 1 байт. Время доступа самого современного жесткого диска (винчестера) составляет примерно 10 миллисекунд (10“® секунды). А современная оперативная память обладает временем доступа порядка 5 наносекунд (5*10“® секунды), т. е. работает примерно в миллион раз быстрее. Конструктивно оперативная память (ОЗУ) персонального компьютера представляет собой совокупность микросхем (чипов), обеспечивающих хранение программ и данных, оперативно обрабатываемых компьютером. 94 Глава 4. Программно-технические системы реализации информационных процессов Существуют два основных типа устройств оперативной памяти: динамическая и статическая память. Динамическая память чаще всего является основной памятью, статическая — дополнительной. Динамическая память стоит много меньпге статической (в расчете на единицу хранимой информации), но по быстродействию значительно уступает современным микропроцессорам. Это означает, что внутрипроцессорные операции со-верпгаются значительно быстрее (в несколько раз), чем обмен информацией между процессором и памятью. Поскольку при исполнении программы постоянно идет обмен данными между процессором и оперативной памятью, то низкое быстодействие динамической памяти тормозит весь процесс. Значит, дополнительно необходима пусть менее емкая, но более «быстрая» память. Это статическая память, которую еще называют кэш-па-мятью. В ней хранятся данные, к которым исполняемая программа обращается наиболее часто. Кэп1-память работает практически с той же скоростью, что и процессор. Использование кэп1-памяти позволяет значительно увеличить производительность системы. Существует еще один вид устройств памяти — постоянное запоминающее устройство (ПЗУ). ПЗУ — энергонезависимое устройство, т. е. данные, находящиеся в нем, не зависят от того, включен ли компьютер. В динамической и статической памяти при исчезновении энергопитания данные практически мгновенно исчезают. В ПЗУ хранится программа запуска компьютера, которая называется BIOS (базовая система вво-да/вывода). BIOS начинает работать после включения питания компьютера. Эта программа загружает с диска операционную систему и далее в работе компьютера не участвует. На рис. 4.1 также представлен еще один вид памяти — видеопамять, обслуживающая устройство визуального отображения выводимой информации — монитор. Сначала формируется содержимое видеопамяти, а затем контроллер монитора выводит изображение на экран. О носителях внепгней памяти уже рассказывалось в § 7. Системная плата Конструктивно упомянутые выпге устройства расположены в персональном компьютере в системном блоке (в настольном варианте ПК). Если снять крыпгку системного блока, то под ней мы обнаружим несколько плат, содержащих многочисленные разъемы и микросхемы. Главная из них — системная плата, называемая также материнской платой. Перечислим лип1ь некоторые компоненты системной платы (рис. 4.3): • гнездо для процессора; • базовая система ввода/вывода (ROM BIOS); • гнезда модулей оперативной памяти DRAM; • разъемы шины; • микросхемы системной логики; • батарея. § 17. Компьютер — универсальная техническая система обработки информации 95 батарея ROM BIOS гнездо для процессора Рис. 4.3. Системная плата Порты ввода/вывода Основные узлы для подключения к компьютеру внешних устройств — порты ввода/вывода: последовательные и параллельные. К последовательным портам чаще всего подключаются устройства, обменивающиеся информацией с компьютером (модем, другой компьютер и т. д.). Термин «последовательный» используется потому, что передача данных осуществляется по специальному кабелю, через который биты информации передаются один за другим. К параллельным портам чаще подключаются те устройства, которые лишь получают информацию от компьютера (например, принтер). Параллельный порт для передачи информации использует одновременно несколько линий и отличается большей пропускной способностью. Кроме подключения принтера параллельный порт используется для соединения компьютеров и для других целей, когда необходима высокая скорость передачи данных. В современных компьютерах используются двунаправленные параллельные порты, позволяющие передавать информацию в обе стороны. Современные виды внешних устройств Современные внешние устройства компьютера обеспечивают ввод и вывод разнообразной информации: текстовой, графической, звуковой. Для ввода текстовой информации используется, прежде всего, клавиатура; для графической информации — сканер; для звуковой — микрофон и звуковая плата. Задача ввода управляющей информации, регулирующей работу компьютера, решается в основном манипуляторами типа мышь. Экран монитора и принтер позволяют с равным успехом выводить текстовую и графическую информацию, а акустические системы (колонки, наушники) — звуковую. 96 Глава 4. Программно-технические системы реализации информационных процессов Современный компьютер, являясь универсальным инструментом обработки информации, способен работать со звуком. При этом звуковая информация — равно как и текстовая, графическая — должна быть представлена в дискретной форме, иначе говоря, оцифрована. Техническое устройство, позволяющее обрабатывать звуковую информацию, называется звуковой платой. Звуковая плата имеет гнезда для подсоединения микрофона и акустической системы. Возможность одновременной работы разных устройств вывода дала возможность развивать системы мультимедиа. В этих системах интерактивное взаимодействие компьютера с пользователем сопровождается одновременным отображением нескольких видов информации (текстовой, графической и звуковой). Эффективность таких систем при решении ряда задач (например, обучения) весьма высока, что объясняется особенностями человеческого восприятия информации одновременно несколькими органами чувств. Сетевое оборудование Дополнительную и весьма важную группу технических средств ПК составляют устройства, которые обеспечивают сетевое подключение и работу компьютеров в сети. Часть этих устройств может располагаться на столе рядом с компьютером (например, модем, соединяющий компьютер с телефонной сетью); часть — в отдалении, рядом с сервером (например, маршрутизаторы, выполняющие пересылку данных между двумя сетями с возможно разными технологиями связи). Перспективные направления развития компьютеров Завершая обсуждение особенностей внутренней структуры современных персональных компьютеров, укажем несколько характерных тенденций ее развития. Во-первых, постоянно расширяется и совершенствуется набор внешних устройств. Во-вторых, компьютеры перестают быть однопроцессорными — и не только благодаря наличию контроллеров внешних устройств. В компьютере могут использоваться дополнительные специализированные процессоры для быстрых математических вычислений, видеопроцессоры для ускорения вывода информации на экран монитора и др. Следует знать, что кроме персональных компьютеров на практике существуют и другие, многократно более мощные вычислительные системы. Без них было бы невозможно решение ряда сложных научно-технических и оборонных задач, обработка огромных баз данных, поддержка крупных коммуникационно-вычислительных сетей (включая Интернет). К компьютерам более высокого уровня, чем ПК, относятся: • мощные микрокомпьютеры, выполняющие специализированные работы высокого профессионального уровня (например, проектноконструкторские (графические)); • серверы в глобальной компьютерной сети, управляющие ее работой и хранящие огромные объемы информации; • многопроцессорные системы параллельной обработки данных. § 18. Программное обеспечение компьютера 97 Система основных понятий Устройство компьютера Компьютер — это универсальное программно управляемое автоматическое устройство _____ для обработки информации различных видов________________ Архитектура персонального компьютера Архитектура фон Неймана Шинная: устройства взаимодействуют через общую магистраль — шину Открытая: изменяемый состав устройств Централизованная: устройства взаимодействуют через центральный процессор Фиксированная: неизменный набор устройств Современные технические решения и устройства Контроллер — Общая Кэш ПЗУ — Видеопамять: Звуковая специализиро- шина: память — энергонеза- служит для фор- плата — ванный про- служит для «быстрая» висимая па- мирования изо- устрой- цессор, управ- передачи память для мять для бражения, вы- ство для ляющий рабо- данных и хранения программы водимого на эк- оцифро- той внешнего сигналов оператив- первона- ран монитора вывания устройства управления ных дан- чальной звука между ных загрузки Мультимедиа — устройст- компьютера синтез различных способов iSilJVLJl вывода информации Дополнительные устройства: мышь, сканер, модем, маршрутизатор, плоттер и пр. Вопросы и задания 1. Чем принципиально отличается архитектура персонального компьютера от классической архитектуры компьютеров первых поколений? 2. Какие функции выполняют контроллеры внешних устройств? 3. В чем состоит принцип открытости архитектуры персонального компьютера? 4. Найдите в литературе или в Интернете характеристики современных микропроцессоров, устройств статической и динамической памяти, внешних запоминающих устройств, устройств отображения информации (вывода) и сравните их с аналогичными характеристиками устройств первых ЭВМ. Программное обеспечение компьютера Компьютер — это программно управляемое автоматическое устройство для работы с информацией. Без программ любой компьютер — просто « железо ». 98 Глава 4. Программно-технические системы реализации информационных процессов Совокупность программ, хранящихся в долговременной памяти компьютера, составляют программное обеспечение (ПО) компьютера. Все множество программ, составляющих ПО, можно разделить на три группы: • прикладные программы; • системные программы; • системы программирования. Общая схема состава программного обеспечения компьютера приведена на рис. 4.4. Системное ПО Операционные системы Антивирусные программы - Архиваторы Программное обеспечение Программы обслуживания жесткого диска Прикладное ПО общего назначения Прикладное профессионально ориентированное ПО Текстовые процессоры Табличные процессоры Графические редакторы Системы мультимедиа Системы управления базами данных (♦настольные») Браузеры Интернета Программы професс ионал ьных математических расчетов Издательские системы Системы программирования Системы автоматизированного проектирования Системы программирования на Паскале Системы программирования на Си Бухгалтерские программы L- Почтовые программы Рис. 4.4. Состав программного обеспечения компьютера Прикладное программное обеспечение Прикладные программы дают возможность пользователю непосредственно решать свои информационные задачи, создавать и обрабатывать информационные объекты. § 18. Программное обеспечение компьютера 99 Информационный объект: • обладает определенными потребительскими качествами (т. е. он нужен пользователю); • допускает хранение на цифровых носителях в виде самостоятельной информационной единицы (файла, папки, архива); • допускает выполнение над ним определенных действий путем использования аппаратных и программных средств компьютера. Прикладное программное обеспечение делится на две части. К первой части относятся те программы, которые полезны большинству пользователей независимо от их профессиональных интересов. Они называются прикладными программами общего назначения. В таблице 4.1 приведены основные виды прикладных программ (программных комплексов) и соответствующие информационные объекты, которые с их помощью создаются и обрабатываются. В последнее время за списком перечисленных видов программ закрепилось название «офисные программы». Этот список постепенно расширяется: появляются программы-органайзеры, несложные программы верстки макетов печатных изданий и пр. Таблица 4.1. Программы и информационные объекты Программы Информационные объекты Текстовые редакторы и процессоры Текстовые документы I Графические редакторы и пакеты компьютерной графики Графические объекты; чертежи, рисунки, фотографии Табличные процессоры Электронные таблицы СУБД — системы управления базами данных, ориентированные на пользователя Базы данных («настольные») Пакеты мультимедийных презентаций Компьютерные презентации (демонстрации) Клиент-программа электронной почты Электронные письма, архивы, адресные списки Программа-обозреватель Интернета (браузер) Web-страницы, файлы из архивов Интернета и пр. Вторую часть прикладных программ составляют специализированные программы (профессионально ориентированные). Дать их полный перечень практически невозможно. Математики, инженеры, научные работники многих специальностей нуждаются в программах, выполняющих математические расчеты; профессиональные издатели книг не могут довольствоваться текстовыми процессорами общего назначения и нуждаются в специаль- 100 Глава 4. Программно-технические системы реализации информационных процессов ных программах — издательских системах; бухгалтерам и экономистам требуются свои программы. Фактически для любой профессии, связанной с обработкой информации, уже создано свое специализированное ПО. К классу специализированных программ следует отнести также обучающие программы^ с которыми, возможно, вы имели дело на уроках или дома. Кроме того, специально для учителей созданы инструментальные программы, позволяющие им самостоятельно конструировать цифровые (электронные) средства обучения. Совокупность таких средств представляет собой новый вид образовательных ресурсов. Системное программное обеспечение Назначение операционных систем Особое место в программном обеспечении занимают операционные системы. Операционная система — это комплекс программ, обеспечивающих: • управление устройствами и задачами (процессами) — согласованную работу всех аппаратных средств компьютера и выполняемых программ; • работу с файлами — организацию хранения и обработки файлов на внешних носителях; • пользовательский интерфейс — диалог пользователя с компьютером. Кроме того, существуют специальные программы, выполняющие некоторые дополнительные услуги системного характера (например, управление внешними устройствами, архивирование файлов, защиту от вирусов, «лечение» и оптимизацию дисков и т. д.). Эти программы называются утилитами. Управление устройствами В предыдущем параграфе мы отмечали, что современный компьютер может включать много (иногда десятки) устройств — ресурсов компьютера. Эти устройства иногда работают одновременно, иногда «встают в очередь» друг за другом. Это и центральный процессор, и несколько видов устройств оперативной памяти, и периферийные (внешние) устройства, среди которых: • устройства ввода (клавиатура, мышь, сканер и др.); • устройства вывода (монитор, принтер, графопостроитель и др.); • внешние запоминающие устройства (дисководы для магнитных и оптических дисков, устройства для работы с флэш-памятью); • устройства управления (мышь, джойстик и др.); • мультимедийные устройства. Все это оборудование должно работать согласованно, по заданной программе, в едином режиме. При этом скорости работы различных устройств различаются в сотни, тысячи и более раз. Деятельность опера- § 18. Программное обеспечение компьютера 101 ционной системы по управлению ресурсами можно уподобить действиям дирижера, которому надо управлять огромным оркестром, включающим десятки различных инструментов, чтобы они вступали в игру в нужный момент и отдельные звуки переплетались бы в стройную мелодию. Для управления работой внешних устройств в состав операционной системы входят специальные программы, которые называются драйверами внешних устройств. Для каждого типа и каждой конкретной модели внешнего устройства существует свой драйвер. Иногда ОС автоматически подбирает подходящий драйвер, иногда об этом приходится заботиться пользователю. Управление процессами В память компьютера может быть загружено одновременно несколько программ, которые будут выполняться частями параллельно. Иногда мы сознательно поручаем это нашему ПК, запустив, скажем, одновременно почтовую программу и текстовый процессор. Но даже если мы этого не делаем, все равно: на экране идут часы, в то же время компьютер производит незаметные, но совершенно необходимые операции по защите от вирусов, защите от удаленных хакерских атак по сети, контролю состояния устройств и т. д. Каждую выполняемую программу называют процессом. Отсюда термин «управление процессами». Организовать параллельное выполнение программ очень непросто, поскольку они обращаются к одним и тем же ресурсам — к центральному процессору, к различным видам памяти, к внешним устройствам. Решает эту задачу операционная система. Компьютеры первых двух поколений работали в однозадачном режиме'. пока не заканчивалось выполнение очередной программы, другие программы в компьютер не загружались. При этом значительная часть времени уходила на механический ввод программы и данных с перфорационного носителя, вывод на бумажную печать, чтение и запись на магнитные носители. Все это время процессор «простаивал», ожидая, когда свою работу закончат его «медленные сотрудники». Ситуация изменилась с появлением на ЭВМ третьего поколения контроллеров внешних устройств. Стало возможным освободить процессор от управления «неповоротливыми» механизмами, переложив эту задачу на контроллеры. А процессор получил возможность все время заниматься своей основной работой — обработкой данных. Пока одна программа (процесс) ожидает, например, завершения ввода/вывода данных, другая программа может занимать процессор. При этом состояние первого, прерванного процесса должно быть сохранено, чтобы его в нужный момент можно было восстановить и продолжить выполнение программы. Такой режим работы называется многозадачным режимом. Наиболее сложны многопользовательские многозадачные операционные системы, применяемые в многотерминальных системах — вычислительных комплексах, в которых к одному общему компьютеру подключается несколько устройств ввода/вывода или персональных компьютеров (терминалов) для одновременной работы многих пользователей. 102 Глава 4. Программно-технические системы реализации информационных процессов Пользовательский интерфейс Важная функция ОС — поддержка пользовательского интерфейса. В настоящее время общепринятым стал графический интерфейс, поддерживаемый системами меню (по крайней мере, в мире ПК). Наибольшее число ПК во всем мире работают под управлением ОС Windows, с которой вы наверняка знакомы. Тем не менее напомним основные правила пользовательского интерфейса. Взаимодействие пользователя с ОС происходит по схеме: 1) ОС находится в состоянии ожидания команды пользователя; 2) пользователь отдает команду в какой-либо форме (чаще всего — через меню); 3) ОС исполняет команду или сообщает о невозможности выполнения; 4) ОС возвращается в состояние ожидания следующей команды пользователя; и т. д. Графический интерфейс, который пришел на смену некогда существовавшему символьному, позволяет пользователю выбирать объекты для команд с помощью графических образов этих объектов. Когда мы запускаем современную версию ОС Windows, перед нами на экране дисплея возникает Рабочий стол (рис. 4.5), на котором расположено несколько графических объектов — символических изображений тех программ, с которыми пользователь работает наиболее часто. Кроме того, в нижней части экрана находится панель задач, содержащая ряд кнопок для запуска программ. Рис. 4.5. Рабочий стол Windows ХР § 18. Программное обеспечение компьютера 103 Меню — один из основных элементов графического интерфейса. С внедрением панелей с ниспадающими и каскадными меню удалось обеспечить комфортную работу любому пользователю. Каскадные меню предоставляют пользователю список возможных действий с выделенным информационным объектом. На рис. 4.6 видно, что выполняется процедура отправки текстового документа в виде сообщения электронной почты. В зависимости от текущего состояния объекта содержание меню может изменяться. В одном случае некоторые из пунктов могут стать недоступными для выбора, в другом может измениться набор пунктов меню. Меню в приложениях могут настраиваться пользователем. Mftain •)*«•«• ^ bciipr* «ппит ; D Со»д||1»- СЫ+« , G^QmsbTtv... CW40 > У Mt*#» С(и|»*ип>ьк... ^ Спфмпьс4к им>-стр*<Ш ' " Вврст... rvooQip w«b-cix;*MWJ jl Ql npMfUMiWMui) чооогр #№«*тк.. 0|ЙГ Свовстм indSMunert . ICl.WUJT Jtronr ibK a^BвtД>^_ИTCГV-Jl»•,S*.doe IC: V. .^C1P*«T1M■0в>*»^»vцц Лк A 3 К « « Я !“ != pdCanflH^iHtMK ^ГЬг»*ив1)П/... ^ П|»*:1 Ц,(Ь«Ч* >Д»фкс... flt ПаотзИ CnwoPert Рис. 4.6. Каскадное меню Ядро ОС Операционная система — большая и очень сложная программа. Ее объем может быть настолько велик, что она целиком не уместится в оперативной памяти. В ОС выделяется некоторая часть, которая является основой всей системы и называется ядром. В состав ядра входят наиболее часто используемые модули, например средства распределения оперативной памяти и процессора, система прерываний и др. Программы, входящие в состав ядра, при загрузке ОС помещаются в оперативную память, где они постоянно находятся и используются при работе компьютера. Такие программы называются резидентными программами. Остальная часть ОС хранится на жестком диске и автоматически загружается в оперативную память по мере необходимости, а затем удаляется из нее. 104 Глава 4. Программно-технические системы реализации информационных процессов Работа с файлами Работу пользователя с файлами обслуживает подсистема ОС, которая называется файловой системой. Этой функцией ОС вы часто пользуетесь, поэтому сейчас подробно о ней говорить мы не будем. Отметим только то обстоятельство, что на современных компьютерах используется иерархическая, многоуровневая файловая структура. Необходимость этого связана с большим объемом внешних носителей информации. Для ускорения поиска в таких условиях иерархическая структура — самая рациональная. Системы программирования Системы программирования — инструмент для работы профессиональных программистов. Каждая такая система ориентирована на определенный язык программирования: Паскаль, Бейсик, Фортран, Си, Ассемблер и др. Системы программирования позволяют создавать тексты программ, отлаживать и исполнять программы. Все перечисленные выше виды ПО создаются программистами с помощью систем программирования. Вопросы и задания 1. Приведите классификацию программного обеспечения современных компьютеров. 2. В чем принципиальное отличие прикладного программного обеспечения общего назначения от иных видов прикладного программного обеспечения? 3. В чем заключается принцип организации диалога «компьютер-пользователь* с помощью меню? 4. Что такое ядро ОС? 5. Какие программы управляют работой внешних устройств? 6. Что такое система программирования? Дискретные модели данных в компьютере. Представление чисел Главные правила представления данных в компьютере Если бы мы могли заглянуть в содержание компьютерной памяти, то увидели бы там примерно то, что условно изображено на рис. 4.7. § 19. Дискретные модели данных в компьютере. Представление чисел 105 1 1 0 0 1 1 1 1 0 0 0 1 0 1 0 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 0 1 1 1 1 1 0 0 1 0 1 0 0 0 1 1 0 1 1 1 1 1 0 0 0 1 1 0 1 0 0 0 1 0 1 0 1 1 1 0 0 1 0 1 0 1 1 1 0 0 0 1 1 0 1 0 1 0 1 0 1 1 1 1 1 0 0 0 1 1 0 1 0 1 0 1 1 0 0 1 1 1 0 0 0 1 0 1 0 0 1 1 1 1 1 0 0 0 1 1 1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 0 0 0 1 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 1 0 0 1 1 0 1 0 1 1 0 0 1 1 1 0 0 1 1 0 1 0 1 0 1 0 0 1 1 1 1 0 1 0 1 0 1 0 0 1 1 1 0 0 1 1 1 0 1 0 1 0 1 0 1 1 1 0 1 1 1 1 1 0 1 0 1 1 1 0 0 1 1 1 Рис. 4.7. Образ компьютерной памяти Рис. 4.7 отражает известное вам еще из базового курса информатики правило представления данных, которое назовем правилом № 1: данные {и программы) в памяти компьютера хранятся в двоичном виде, т. е. в виде цепочек единиц и нулей. Современный компьютер может хранить и обрабатывать данные, представляющие информацию четырех видов: числовую, текстовую, графическую, звуковую. Двоичный код, изображенный на рис. 4.7, может относиться к любому виду данных. Правило № 2: представление данных в компьютере дискретно. Правило № 3: множество представимых в памяти величин ограничено и конечно. Представление чисел Сначала поясним на образном примере, что такое дискретность. Дискретное множество состоит из отделенных друг от друга элементов. Например, песок дискретен, поскольку он состоит из отдельных песчинок. А вода или масло непрерывны (в рамках нгппих ощущений, поскольку отдельные молекулы мы все равно ощутить не можем). Этот пример нужен нам только для аналогии. Здесь мы не станем углубляться в изз^ение материального мира, а вернемся к предмету изз^ения информатики — информации. Самым традиционным видом данных, с которым работают компьютеры, являются числа. ЭВМ первого поколения умели решать только математические задачи. Люди начгши работать с числами еще с первобытных времен. Первоначально человек оперировгш лишь целыми положительными (натуральными) числами: 1, 2, 3, 4, ... . Очевидно, что натуральный ряд — это дискретное множество чисел. 106 Глава 4. Программно-технические системы реализации информационных процессов В математике ряд натуральных чисел бесконечен и не ограничен. С появлением в математике понятия отрицательного числа (Р. Декарт, XVII век в Европе; в Индии значительно раньше) оказалось, что множество целых чисел не ограничено как «справа», так и «слева». Покажем это на числовой оси (рис. 4.8), символы оо обозначают бесконечность. -00 ... -8 -7 -6 -5 -4 -3 -2 -1 о 1 2 3 4 5 6 7 8 9 ... оо ________I__\__I__I__I_I__I__I__I__I__I__^^____I__^__\__^__\_______► Рис. 4.8. Математическое множество целых чисел на числовой оси Из сказанного следует вывод: множество целых чисел в математике дискретно и не ограничено. Отметим ещ;е один факт: разность соседних чисел натурального ряда (данного и предыдупцего) всегда равна единице. Эту величину назовем шагом числовой последовательности. Любое вычислительное устройство (компьютер, калькулятор) может работать только с ограниченным множеством целых чисел. Возьмите в руки калькулятор, на индикаторном табло которого помепцается 10 знаков. Самое большое положительное число, которое на него поместится: Самое большое по абсолютной величине (модулю) отрицательное число: Аналогично дело обстоит и в компьютере. Целые числа в компьютере Правило № 4: в памяти компьютера числа хранятся в двоичной системе счисления . С двоичной системой счисления вы знакомы из базового курса информатики. Например, если под целое число выделяется ячейка памяти размером в 16 битов, то самое большое целое положительное число будет таким: 1 1 ® 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 В десятичной системе счисления оно равно: 1 = 32 767. * Конечно, и « внутри калькулятора» числа представляются в двоичном виде. Однако мы в это вдаваться не будем, рассмотрев лишь внешнее представление. Пример с калькулятором нам нужен был только для иллюстрации проблемы ограниченности. § 19. Дискретные модели данных в компьютере. Представление чисел 107 Здесь первый бит играет роль знака числа. Ноль — признак положительного числа. Самое большое по модулю отрицательное число равно —32 768. Напомним (это было в базовом курсе информатики), как получить его внутреннее представление: 1) перевести число 32 768 в двоичную систему счисления; это легко, поскольку 32 768 = 2^^: 1000000000000000; 2) инвертировать этот двоичный код, т. е. заменить нули на единицы, а единицы — на нули: 0111111111111111; 3) прибавить единицу к этому двоичному числу (складывать надо по правилам двоичной арифметики), в результате получим: 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Единица в первом бите обозначает знак «минус». Не нужно думать, что полученный код — это «минус ноль». Этот код представляет число -32 768. Таковы правила машинного представления целых чисел. Данное представление называется дополнительным кодом. Если под целое число в памяти компьютера отводится N битов, то диапазон значений целых чисел: 2^-^ - 1]. То есть ограниченность целого числа в компьютере возникает из-за ограничений на размер ячейки памяти. Отсюда же следует и конечность множества целых чисел. Мы рассмотрели формат представления целых чисел со знаком, т. е. положительных и отрицательных. Бывает, что нужно работать только с положительными целыми числами. В таком случае используется формат представления целых чисел без знака. В этом формате самое маленькое число — ноль (все биты — нули), а самое большое число для 16-разрядной ячейки: В десятичной системе это 2^® — 1 = 65 535, примерно в два раза больше по модулю, чем в представлении со знаком. Из всего сказанного делаем вывод: целые числа в памяти компьютера — это дискретное, ограниченное и конечное множество. Границы множества целых чисел зависят от размера выделяемой ячейки памяти под целое число, а также от формата: со знаком или без знака. Шаг в компьютерном представлении последовательности целых чисел, как и в математическом, остается равным единице. 108 Глава 4. Программно-технические системы реализации информационных процессов Рис. 4.9 отражает то обстоятельство, что при переходе от математического представления множества целых чисел к представлению, используемому в информатике (компьютере), происходит переход к ограниченности и конечности. Рис. 4.9. Представление о множестве целых чисел в математике и в информатике Вещественные числа в компьютере Понятие вещественного (действительного) числа в математику ввел Исаак Ньютон в XVIII веке. В математике множество вещественных чисел непрерывно, бесконечно и не ограничено. Оно включает в себя множество целых чисел и еще бесконечное множество нецелых чисел. Между двумя любыми точками на числовой оси лежит бесконечное множество вещественных чисел, что и означает непрерывность множества. Как мы говорили выше, числа в компьютере (в том числе и вещественные) представлены в двоичной системе счисления. Покажем, что множество вещественных чисел в компьютере дискретно, ограничено и конечно. Нетрудно догадаться, что это, так же как и в случае целых чисел, вытекает из ограничения размера ячейки памяти. Снова для примера возьмем калькулятор с десятиразрядным индикаторным табло. Экспериментально докажем дискретность представления вещественных чисел. Выполним на калькуляторе деление 1 на 3. Из математики вам известно, что 1/3 — это рациональная дробь, представление которой в виде десятичной дроби содержит бесконечное количество цифр: 0,3333333333... (3 в периоде). На табло калькулятора вы увидите: 0. 3 3 3 3 3 3 3 3 Первый разряд зарезервирован под знак числа. После запятой сохраняется 8 цифр, а остальные не вмещаются в разрядную сетку (так это обычно называют). Значит, это не точное значение, равное 1/3, а его «урезанное» значение. Следующее по величине число, которое помещается в разрядную сетку: 0. 3 3 3 3 3 3 3 4 § 19. Дискретные модели данных в компьютере. Представление чисел 109 Оно больше предыдуш;его на 0,00000001. Это шаг числовой последовательности. Следовательно, два рассмотренных числа разделены между собой конечным отрезком. Очевидно, что предыдуш;ее число такое: 0. 3 3 3 3 3 3 3 2 Оно тоже отделено от своего «соседа справа» по числовой оси шагом 0,00000001. Отсюда делаем вывод: множество вещественных чисел, представимых в калькуляторе, дискретно, поскольку числа отделены друг от друга конечными отрезками. А теперь выясним вот что: будет ли шаг в последовательности веш;ест-венных чисел на калькуляторе постоянной величиной (как у целых чисел)? Вычислим выражение 100000/3. Получим: 3. Это число в 100 000 раз больше предыдуш;его и, очевидно, тоже приближенное. Легко понять, что следующее вещественное число, которое можно получить на табло калькулятора, будет больше данного на 0,0001. Шаг стал гораздо больше. -МАХ о МАХ Числовая ось Рис. 4.10. Условное представление взаимного расположения множества вещественных чисел, представимых в компьютере Отсюда приходим к выводу: множество вещественных чисел, представимых в калькуляторе, дискретно с переменной величиной шага между соседними числами. Если отметить на числовой оси точные значения вещественных чисел, которые представимы в калькуляторе, то эти точки будут расположены вдоль оси неравномерно. Ближе к нулю — гуще, дальше от нуля — реже. Все выводы, которые мы делаем на примере калькулятора, полностью переносятся на компьютер с переходом к двоичной системе счисления и с учетом размера ячейки компьютера, отводимой под вещественные числа. Неравномерное расположение вещественных чисел, представимых в компьютере, также имеет место. Ответим на вопрос, ограничено ли множество вещественных чисел в памяти компьютера. Если продолжать эксперименты с калькулятором, то ответ на этот вопрос будет таким: да, множество вещественных чисел в калькуляторе ограничено. Причиной тому служит все та же ограниченность разрядной сетки. Отсюда же следует и конечность множества. 110 Глава 4. Программно-технические системы реализации информационных процессов Самое большое число у разных калькуляторов может оказаться разным. У самого простого это будет то же число, что мы получали раньше: 999999999. Если прибавить к нему единицу, то калькулятор выдаст сообщение об ошибке. А на другом, более «умном» и дорогом калькуляторе, прибавление единицы приведет к такому результату: -f Данную запись на табло надо понимать так: 1 х 10 Такой формат записи числа называется форматом с плавающей запятой, в отличие от всех предыдущих примеров, где рассматривалось представление чисел в формате с фиксированной запятой. Число, стоящее перед буквой «е», называется мантиссой, а стоящее после — порядком. «Умный калькулятор» перешел к представлению чисел в форме с плавающей запятой после того, как под форму с фиксированной запятой не стало хватать места на табло. В компьютере то же самое: числа могут представляться как в форме с фиксированной запятой (обычно это целые числа), так и в форме с плавающей запятой. Но и для формы с плавающей запятой тоже есть максимальное число. В нашем «подопытном» калькуляторе это такое число: 9 9 9 9 9 е + 9 9 То есть 99999 х 10 Самое большое по модулю отрицательное значение -99999 X 10 ^ . Данные числа являются целыми, но именно они ограничивают представление любых чисел (целых и вещественных) в калькуляторе. В компьютере все организовано аналогично, но предельные значения еще больше. Это зависит от разрядности ячейки памяти, выделяемой под число, и от того, сколько разрядов выделяется под порядок и под мантиссу. Рассмотрим пример: пусть под всё число в компьютере выделяется 8 байтов — 64 бита, из них под порядок — 2 байта, под мантиссу — 6 байтов. Тогда диапазон вещественных чисел, в переводе в десятичную систему счисления, оказывается следующим: ±(510“^^^-1,7-10'’'^°). Завершая тему, посмотрим на рис. 4.11. Смысл, заложенный в нем, такой: непрерывное, бесконечное и не ограниченное множество вещественных чисел, которое рассматривает математика, при его представлении в компьютере обращается в дискретное, конечное и ограниченное множество. 308ч § 19. Дискретные модели данных в компьютере. Представление чисел 111 Рис. 4.11. Представление о множестве вещественных чисел в математике и в информатике Система основных понятий Представление чисел Целые числа Вещественные числа В математике: В компьютере (в информатике): В математике: В компьютере: (в информатике) - десятичное - двоичное - десятичное - двоичное представление; представление; представление; представление; - множество: - множество: - множество: - множество: дискретно. дискретно. непрерывно. дискретно. бесконечно. конечно, бесконечно. конечно. не ограничено ограничено не ограничено ограничено Представление целых чисел Представление вещественных чисел в компьютере в компьютере Со знаком Без знака Л/х 2^ (положительные и отрицательные) (положительные) М — двоичная мантисса, Р — двоичный целый порядок Диапазон: Диапазон: Диапазон ограничен максимальными [_2Лг-1 [0, 2^'] значениями М иР Формат с фиксированной запятой Формат с плавающей запятой Вопросы и задания 1. Почему множество целых чисел, представимых в памяти компьютера, дискретно, конечно и ограничено? 2. Определите диапазон целых чисел, хранящихся в 1 байте памяти в двух вариантах: со знаком и без знака. 112 Глава 4. Программно-технические системы реализации информационных процессов 3. Получите внутреннее представление числа 157 в 8-разрядной ячейке памяти в формате со знаком. 4. Получите внутреннее представление числа -157 в 8-разрядной ячейке памяти в формате со знаком. 5. Почему множество действительных (вещественных) чисел, представимых в памяти компьютера, дискретно, конечно и ограничено? 6. На какие две части делится число в формате с плавающей запятой? Дискретные модели данных в компьютере. Представление текста, графики и звука В этом параграфе обсудим способы компьютерного кодирования текстовой, графической и звуковой информации. С текстовой и графической информацией конструкторы ЭВМ «научили» работать махпины, начиная с третьего поколения (1970-е годы). А работу со звуком «освоили» лишь машины четвертого поколения, современные персональные компьютеры. С этого момента началось распространение технологии мультимедиа. Что принципиально нового появлялось в устройстве компьютеров с освоением ими новых видов информации? Главным образом, это периферийные устройства для ввода и вывода текстов, графики, видео, звука. Процессор же и оперативная память по своим функциям изменились мало. Существенно возросло их быстродействие, объем памяти. Но, как это было на первых поколениях ЭВМ, так и осталось на современных ПК — основным навыком процессора в обработке данных является умение выполнять вычисления с двоичными числами. Обработка текста, графики и звука представляет собой тоже обработку числовых данных. Если сказать еще точнее — то это обработка целых чисел. По этой причине компьютерные технологии называют цифровыми технологиями. О том, как тексты, графика и звук сводятся к целым числам, будет рассказано дальше. Предварительно отметим, что здесь мы снова встретимся с главной формулой информатики: 2' = А. Смысл входящих в нее величин здесь следующий: i — разрядность ячейки памяти (в битах), N — количество различных целых положительных чисел, которые можно записать в эту ячейку. Текстовая информация Принципиально важно, что текстовая информация уже дискретна — состоит из отдельных знаков. Поэтому возникает лишь технический вопрос, как разместить ее в памяти компьютера. § 20. Дискретные модели данных в компьютере. Представление текста, графики и звука 113 Напомним о байтовом принципе организации памяти компьютеров, обсуждавшемся в базовом курсе информатики. Вернемся к рис. 4.7. Каждая клеточка на нем обозначает бит памяти. Восемь подряд расположенных битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. Именно по адресам процессор обраш;ается к данным, читая или записывая их в память (рис. 4.12). I байт № 1 байт 2 Рис. 4.12. Байтовая организация памяти Модель представления текста в памяти весьма проста. За каждой буквой алфавита, цифрой, знаком препинания и иным обш;епринятым при записи текста символом закрепляется определенный двоичный код, длина которого фиксирована. В популярных системах кодировки (ASCII, KOI8 и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число; оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице. Согласно главной формуле информатики, определяем, что размер алфавита, который можно закодировать, равен: 2® = 256. Этого количества вполне достаточно для размеш;ения двух алфавитов естественных языков (английского и русского) и всех необходимых дополнительных символов. Поскольку в мире много языков и много алфавитов, то постепенно совершается переход на международную 16-битовую систему кодировки Unicode. В ней каждый символ занимает 2 байта, что обеспечивает 2^® = 65 536 кодов для различных символов. При работе с электронной почтой почтовая программа иногда нас спрашивает, не хотим ли мы прибегнуть к кодировке Unicode для пересылаемых сообш;ений. Таким способом можно избежать проблемы несоответствия кодировок, из-за которой иногда не удается прочитать русский текст. Не следует представлять себе текст, хранимый в памяти компьютера или на внешнем носителе, лишь как поток байтов, каждый из которых является лишь кодом символа текста. Форматы хранения текстовой информации определяются форматами текстовых файлов, используемых той или иной программой обработки текстов. Файлы, создаваемые с по-мош;ью текстовых процессоров (например, Microsoft Word), включают в себя не только коды символов алфавита, но и данные формата: тип и размер шрифта, положение строк, поля и отступы и прочую дополнительную информацию. Графическая информация Из базового курса информатики вы знакомы с обш;ими принципами компьютерной графики, с графическими технологиями. Здесь мы немно- 114 Глава 4. Программно-технические системы реализации информационных процессов ГО подробнее, чем это делалось раньше, рассмотрим способы представления графических изображений в памяти компьютера. Принцип дискретности компьютерных данных справедлив и для графики. Здесь можно говорить о дискретном представлении изображения (рисунка, фотографии, видеокадров) и дискретности цвета. Дискретное представление изображения. Изображение на экране монитора дискретно. Оно составляется из отдельных точек, которые называются пикселями (picture elements — элементы рисунка). Это связано с техническими особенностями устройства экрана, независимо от его физической реализации, будь то традиционный дисплей на электронно-лучевой трубке, жидкокристаллический или плазменный. Эти «точки» столь близки друг другу, что глаз не различает промежутков между ними, поэтому изображение воспринимается как непрерывное, сплошное. Если выводимое из компьютера изображение формируется на бумаге (принтером или плоттером), то линии на нем также выглядят непрерывными. Однако в основе все равно лежит печать близких друг к другу точек. В зависимости от того, на какое графическое разрешение экрана настроена операционная система компьютера, на экране могут размещаться изображения, имеющие размер 640x480, 800x600, 1024x768 и более пикселей. Такая прямоугольная матрица пикселей на экране компьютера называется растром. Качество изображения зависит не только от размера растра, но и от размера экрана монитора, который обычно характеризуется длиной диагонали. Существует параметр разрешения экрана. Этот параметр измеряется в точках на дюйм (по-английски dots per inch — dpi). У монитора с диагональю 15 дюймов размер изображения на экране составляет примерно 28x21 см. Зная, что в одном дюйме 25,4 мм, можно рассчитать, что при работе монитора в режиме 800x600 пикселей разрешение экранного изображения равно 72 dpi. При печати на бумаге разрешение должно быть намного выше. Полиграфическая печать полноцветного изображения требует разрешения 200-300 dpi. Стандартный фотоснимок размером 10x15 см должен содержать примерно 1000x1500 пикселей. Дискретное представление цвета. Восстановим ваши знания о кодировании цвета, полученные из базового курса информатики. Основное правило звучит так: любой цвет точки на экране компьютера получается путем смешивания трех базовых цветов: красного, зеленого, синего. Этот принцип называется цветовой моделью RGB (Red, Green, Blue). Двоичный код цвета определяет, в каком соотношении находятся интенсивности трех базовых цветов. Если все они смешиваются в одинаковых долях, то в итоге получается белый цвет. Если все три компоненты «выключены», то цвет пикселя — черный. Все остальные цвета лежат между белым и черным. Дискретность цвета состоит в том, что интенсивности базовых цветов могут принимать конечное число дискретных значений. § 20. Дискретные модели данных в компьютере. Представление текста, графики и звука 115 Пусть, например, размер кода цвета пикселя равен 8 битам — 1 байту. Между базовыми цветами они могут быть распределены так: К К 2 бита под красный цвет, 3 бита — под зеленый и 3 бита — под синий. Интенсивность красного цвета может принимать 2^ = 4 значения, интен- о сивности зеленого и синего цветов — по 2 =8 значений. Полное число цве-тов, которые кодируются 8-разрядными кодами, равно: 4 x 8 x 8 = 256 = 2 . Снова работает главная формула информатики. Из описанного правила, в частности, следует: красный о зеленый о синий о — код черного цвета — код белого цвета — код бледно-серого цвета — код ярко-зеленого цвета — код бледно-зеленого цвета Обобщение этих частных примеров приводит к следующему правилу. Если размер кода цвета равен Ъ битов, то количество цветов (размер палитры) вычисляется по формуле: К = 2^ Величину Ъ в компьютерной графике называют битовой глубиной цвета. Еще один пример. Битовая глубина цвета равна 24. Размер палитры будет равен: К = = 16 777 216. В компьютерной графике используются разные цветовые модели для изображения на экране, получаемого путем излучения света, и изображения на бумаге, формируемого с помощью отражения света. Первую модель мы уже рассмотрели — это модель RGB. Вторая модель носит название CMYK. Цвет, который мы видим на листе бумаги, — это отражение белого (солнечного) света. Нанесенная на бумагу краска поглощает часть палитры, составляющей белый цвет, а другую часть отражает. Таким образом, нужный цвет на бумаге получают путем «вычитания» из белого цвета «ненужных красок». Поэтому в цветной полиграфии действует не правило сложения цветов (как на экране компьютера), а правило вычитания. Мы не будем углубляться в механизм такого способа цветообразования. Расшифруем лишь аббревиатуру CMYK: Cyan — голубой. Magenta — пурпурный. Yellow — желтый, ЫасК — черный. 116 Глава 4. Программно-технические системы реализации информационных процессов Растровая и векторная графика О двух технологиях компьютерной графики — растровой и векторной — вы знаете из базового курса информатики. В растровой графике графическая информация — это совокупность данных о цвете каждого пикселя на экране. Это то, о чем говорилось выше. В векторной графике графическая информация — это данные, математически описывающие графические примитивы, составляющие рисунок: прямые, дуги, прямоугольники, овалы и пр. Положение и форма графических примитивов представляются в системе экранных координат. Растровую графику (редакторы растрового типа) применяют при разработке электронных (мультимедийных) и полиграфических изданий. Растровые иллюстрации редко создают вручную с помощью компьютерных программ. Чаще для этой цели используют сканированные иллюстрации, подготовленные художником на бумаге, или фотографии. Для ввода растровых изображений в компьютер применяются цифровые фото- и видеокамеры. Большинство графических редакторов растрового типа в большей мере ориентированы не на создание изображений, а на их обработку. Достоинство растровой графики — эффективное представление изображений фотографического качества. Основной недостаток растрового способа представления изображения — большой объем занимаемой памяти. Для его сокращения приходится применять различные способы сжатия данных. Другой недостаток растровых изображений связан с искажением изображения при его масштабировании. Поскольку изображение состоит из фиксированного числа точек, то увеличение изображения приводит к тому, что эти точки становятся крупнее. Увеличение размера точек растра визуально искажает иллюстрацию и делает ее грубой. Векторные графические редакторы предназначены, в первую очередь, для создания иллюстраций и в меньшей степени для их обработки. Достоинства векторной графики — сравнительно небольшой объем памяти, занимаемой векторными файлами, масштабирование изображения без потери качества. Однако средствами векторной графики проблематично получить высококачественное художественное изображение. Обычно средства векторной графики используют не для создания художественных композиций, а для оформительских, чертежных и проектно-конструкторских работ. Графическая информация сохраняется в файлах на диске. Существуют разнообразные форматы графических файлов. Они делятся на растровые и векторные. Растровые графические файлы (форматы JPEG, BMP, TIFF и другие) хранят информацию о цвете каждого пикселя изображения на экране. В графических файлах векторного формата (например, WMF, CJM) содержатся описания графических примитивов, составляющих рисунок. Следует понимать, что графические данные, помещаемые в видеопамять и выводимые на экран, имеют растровый формат вне зависимости от того, с помощью каких программных средств (растровых или векторных) они получены. § 20. Дискретные модели данных в компьютере. Представление текста, графики и звука 117 Звуковая информация Принципы дискретизации звука («оцифровки» звука) отражены на рис. 4.13. {у — интенсивность (уровень) звукового сигнала, t — время) Ввод звука в компьютер производится с помощью звукового устройства (микрофона, радио и др.), выход которого подключается к порту звуковой карты. Задача звуковой карты — с определенной частотой производить измерения уровня звукового сигнала (преобразованного в электрические колебания) и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука. Промежуток времени между двумя измерениями называется периодом измерений — тс. Обратная величина называется частотой дискретизации — 1/т (герц). Чем выше частота измерений, тем выше качество цифрового звука. Результаты таких измерений представляются целыми положительными числами с конечным количеством разрядов. Вы уже знаете, что в таком случае получается дискретное конечное множество значений в ограниченном диапазоне. Размер этого диапазона зависит от разрядности ячейки — регистра памяти звуковой карты. Снова работает формула 2', где i — разрядность регистра. Число i назывгпот также разрядностью дискретизации. Записанные данные сохраняются в файлах специальных звуковых форматов. Существуют программы обработки звука — редакторы звука, позволяющие создавать различные музыкальные эффекты, очищать звук от шумов, согласовывать с изображениями для создания мультимедиа продуктов и т. д. С помощью специальных устройств, генерирующих звук, звуковые файлы могут преобразовываться в звуковые волны, воспринимаемые слухом человека. При хранении оцифрованного звука приходится решать проблему уменьшения объема звуковых файлов. Для этого кроме кодирования данных без потерь, позволяющего осуществлять стопроцентное восстановле- 118 Глава 4. Программно-технические системы реализации информационных процессов ние данных из сжатого потока, используется кодирование данных с потерями. Цель такого кодирования — добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных. Это достигается путем использования различных алгоритмов, сжимающих оригинальный сигнал путем выкидывания из него слабослышимых элементов. Методов сжатия, а также программ, реализующих эти методы, существует много. Для сохранения звука без потерь используется универсальный звуковой формат файлов WAV. Наиболее известный формат «сжатого» звука (с потерями) — MP3. Он обеспечивает сжатие данных в 10 раз и более. Система основных понятий Дискретные модели данных Текст Графика Звук Таблицы кодировки Дискретность изображения Дискретность цвета Дискретные измерения звукового сигнала 8-раз- рядные 16-раз- рядная Растр — сетка пикселей Модели цвета Частота дискре- тизации Разрядность дискретизации ASCII, KOI8 и др. Unicode MxN — размер растра, dpi — разрешение RGB Излуча- емый цвет CMYK Отража- емый цвет 1/ период (герц) 2‘ = JV, i — разрядность, N — количество уровней измерения звука Вопросы и задания 1. Когда компьютеры начали работать с текстом, с графикой, со звуком? 2. Что такое таблица кодировки? Какие существуют таблицы кодировки? 3. На чем основывается дискретное представление изображения? 4. Что такое модель цвета RGB? 5. Напишите 8-разрядный код ярко-синего цвета, ярко-желтого (смесь красного с зеленым), бледно-желтого. 6. Почему в полиграфии не используется модель RGB? 7. Что такое CMYK? 8. Какое устройство в компьютере производит оцифровку вводимого звукового сигнала? 9. Как (качественно) качество цифрового звука зависит от частоты дискретизации и разрядности дискретизации? 10. Чем удобен формат MP3? § 21. Развитие архитектуры вычислительных систем 119 Развитие архитектуры вычислительных систем Продолжим обсуждение того, в каких направлениях развивается архитектура вычислительных систем. Этот процесс определяется, с одной стороны, требованиями больпюй эффективности и скорости обработки информации, с другой — появлением новых технических возможностей. Зачем нужны сверхбыстрые компьютеры Несмотря на стремительно нарастающую производительность компьютеров, которая каждые 4-5 лет практически по важнейп1им показателям удваивается, всегда есть классы задач, для которых даже такой производительности не хватает. Укажем некоторые из них. 1. Математические расчеты, лежащие в основе реализации математических моделей многих процессов. Гигантские вычислительные ресурсы необходимы для более надежного и долгосрочного прогноза погоды, для реп1ения аэрокосмических задач, в том числе и оборонных, для репюния многих инженерных задач и т. д. 2. Поиск информации в гигантских базах данных, достигающих по объему хранимой информации нескольких терабайтов (1 терабайт = = 1024 Гбайт = Ю^^байт). 3. Моделирование интеллекта. При всех фантастических показателях объем оперативной памяти современных компьютеров составляет лип1ь малую долю объема памяти человека. Как можно ускорить работу компьютера Вернемся к архитектуре компьютера четвертого поколения, изображенной на рис. 4.1. У компьютера имеется много внеп1них устройств, но только один, нацеленный непосредственно на выполнение программы, процессор (контроллеры не в счет, у них иные функции), одна П1ина и одна оперативная память. При реп1ении с помощью такого компьютера любой задачи основной цикл работы состоит из следующих этапов: 1) процессор считывает очередную команду программы; 2) эта команда расп1ифровывается, из оперативной памяти извлекаются указанные в ней данные, над ними выполняется требуемое действие; 3) результаты действия записываются в оперативную память (если действие того требует) и всё повторяется заново, пока не произойдет остановка по какой-то причине. Конечно, по мере соверп1енствования компьютеров в этой схеме появились некоторые дополнительные возможности: небольшая собственная память у процессоров, кэш-память, так называемая конвейерная обработ- 120 Глава 4. Программно-технические системы реализации информационных процессов ка, когда процессор, выполняя текущую команду, «заглядывает» в следующую и кое-что для ее выполнения делает. Все это важно, но в какой-то момент потребовалось сделать принципиальный niar и отказаться от единичности главных устройств компьютера: либо процессора, либо оперативной памяти, либо шины, либо всего этого вместе взятого. Так родилась совершенно новая архитектура, с которой в настоящее время связываются, пожалуй, большие надежды в области роста производительности компьютеров, нежели с совершенствованием отдельных узлов. Чтобы стало более понятным, зачем компьютеру несколько процессоров, обсудим решение простейшей математической задачи. Есть массив из 100 чисел: а\, U2, . . . аюо* Требуется найти их сумму. Нет ничего проще. И на компьютере, и без него мы, скорее всего, поступим так: сложим первые два числа, обозначим как-то их сумму (например, S), затем прибавим к ней третье число, и будем делать это еще 98 раз. Это пример последовательного вычислительного процесса. Его блок-схема приведена на рис. 4.14. Рис. 4.14. Алгоритм последовательного решения задачи сложения массива чисел Поскольку ни у кого из нас нет второй головы, то иначе эту задачу в одиночку не решить. Но представим, что мы решаем ее не в одиночку, а всем классом (25 человек). Тогда возникает возможность совсем иной последовательности действий: 1. Объединить числа в пары — по два на каждого ученика (итого распределим 50 чисел): например, ученик Петя Иванов берет себе ai и «2, ученик Ваня Петров — «з и «4, и т. д. 2. Дать команду «Складывай!» — Каждый складывает свои числа. 3. Дать команду «Записывай!» — Каждый записывает мелом на классной доске свой результат. § 21. Развитие архитектуры вычислительных систем 121 4. Поскольку у нас осталось еще 50 необработанных чисел {аы,. • • аюо)> повторить пункты 1-3. После этого имеем на доске 50 чисел; Ь\ = а\ + аг, • ••> ^50 = аэ9 + O'loo — результаты парных сложений. 5. Объединить в пары числа bi и повторить пункты 2—4, пока не останется одно число. Первое впечатление — очень сложно, гораздо сложнее, чем на рис. 4.14. Если бы мы захотели записать этот алгоритм в виде блок-схемы, то нам бы пришлось, кроме описания порядка действий и объектов действий, сделать то, чего мы никогда при записи алгоритмов еще не делали, — предусмотреть синхронизацию параллельных процессов по времени. Например, выполнение команд 2 и 3 должно завершиться всеми участниками вычислений до нового объединения чисел в пары (перехода к пункту 4), иначе даже при решении этой простой задачи наступит хаос. Но сложность не есть объективная причина отвергнуть такой путь, особенно если речь идет о возможности значительного ускорения компьютерных вычислений. То, что мы предложили выше, называется на языке программистов распараллеливанием вычислений и вполне поддается формальному описанию. Эффект ускорения вычислений очевиден: пункт 2 в приведенном выше алгоритме ускоряет соответствующий этап работы в 25 раз! Следующий вопрос: что надо изменить в устройстве компьютера, чтобы он смог так работать? Для реализации подобной схемы вычислений компьютеру потребуется 25 процессоров, объединенных в одну архитектуру и способных работать параллельно. Такие многопроцессорные вычислительные комплексы — реальность сегодняшней вычислительной техники. Вернемся, однако, к описанной выше последовательности действий — в ней еще есть источники проблем. Представим себе, что в схеме на рис. 4.1 мы дорисовали еще 24 центральных процессора, соединенных с шиной. При реализации в таком компьютере команды 3 из нашего примера произойдет одновременное обращение 25 процессоров к системной шине для пересылки результатов сложения в оперативную память. Но поскольку шина одна, то и числа могут пересылаться в память только по одному. Значит, для выполнения команды 3 придется организовать очередь на передачу чисел в память. Тут же возникает вопрос: не сведет ли к нулю эта очередь все преимущества от параллельности выполнения операций на шаге 2? А если преимущества останутся, то насколько они будут велики? Окупятся ли расходы на 24 дополнительных процессора? В возникшей ситуации естественен следующий шаг: ввод в архитектуру нескольких системных шин. А если еще подумать над возможными проблемами, то и нескольких устройств оперативной памяти. Как видите, все это очень непросто. Обсуждаемые изменения в устройстве компьютера приводят к принципиально новым архитектурам, отличным от архитектуры фон Неймана. Изобретателям таких систем приходится искать компромисс между возрастающей сложностью (и, как следствие, — стоимостью) и ускорением их работы. 122 Глава 4. Программно-технические системы реализации информационных процессов Варианты реализации параллельных вычислительных систем В самом общем смысле под параллельными вычислениями понимаются процессы обработки данных, в которых одновременно могут выполняться несколько машинных операций. Распределенные вычисления — способ реализации параллельных вычислений путем использования множества компьютеров, объединенных в сеть. Такие вычислительные системы еще называют мультикомпьютер-ными системами. Распределенные вычисления часто реализуются с помощью компьютерных кластеров — нескольких компьютеров, связанных в локальную сеть и объединенных специальным программным обеспечением, реализующим параллельный вычислительный процесс. Распределенные вычисления могут производиться и с помощью многомашинных вычислительных комплексов, образуемых объединением нескольких отдельных компьютеров через глобальные сети. Мультипроцессорная система реализуется в одном компьютере. Достижение параллелизма в ней происходит благодаря возможности независимой работы отдельных устройств: нескольких процессоров, блоков оперативной памяти, шин и т. д. Мультипроцессорная система может использовать разные способы доступа к общей для всей системы памяти. Все процессоры могут иметь равный (однородный) доступ к единой памяти. К такому типу относятся мощнейшие в мире суперкомпьютеры семейства Cray. Другое решение: для каждого процессора выделяется свой раздел памяти компьютера. На сегодняшний день кластерные системы — это самый дешевый способ организации параллельных вычислений, поскольку для них можно использовать уже имеющиеся у пользователя компьютеры. Однако возможности реализации взаимодействия отдельных компьютеров по сравнению с организацией узлов в мультипроцессорной системе невелики, равно как и скорость передачи данных, и это налагает ограничения на класс решаемых задач. Вопросы и задания 1. Для каких классов задач нужны сверхпроизводительные вычислительные системы? 2. Что такое параллельные вычисления? 3. Для примера со сложением чисел 25 учениками попробуйте проанализировать следующие ситуации: в классе всего 1 кусок мела; в классе 5 кусков мела; в классе 25 кусков мела. Оцените, как от этого зависит время решения задачи (учтите еще ширину доски и время перемещения учеников по классу). Попробуйте построить модель такого процесса. Переведите эту ситуацию на язык компьютерной терминологии для многопроцессорных систем. 4. Попробуйте привести примеры алгоритмов поиска информации в массиве и сортировки массива, которые допускают распараллеливание операций. Они- § 22. Организация локальных сетей 123 шите процедуру распараллеливания. Сколько процессоров необходимо для эффективного распараллеливания в приведенном вами примере? 5. Что такое распределенные вычисления? 6. Чем отличаются мультикомпьютерные системы от мультипроцессорных? Система основных понятий Архитектура параллельных вычислительных систем Цель поиска новых принципов архитектуры — повышение производительности компьютеров для решения классов задач, требующих высокопроизводительных вы- числении: Математическое моделирование Работа с терабайтовыми базами данных Моделирование интеллекта Ведуищй принцип: отказ от последовательности выполнения операций Ведущие направления развития архитектуры: техническое программное техническое программное решение: решение: решение: решение: мультипроцессорные параллельные мультикомпьютер- параллельное системы: вычисления: ные системы (клас- выполнение несколько процессо- выделение в програм- теры): однотипных ров и иных однотип- ме нескольких одно- объединение подпрограмм ных устройств в со- временно выполняе- нескольких ком- ставе вычислитель- мых действий (распа- пьютеров в локаль- ного комплекса, раллеливание) ную сеть для имеющего общую решения одной за- оперативную память дачи Организация локальных сетей Локальная компьютерная сеть — объединение нескольких компьютеров, расположенных на небольшом расстоянии друг от друга (обычно в предел£1х одного здания) для совместного решения информационных, вычислительных, учебных и других задач. В небольшой локальной сети может быть 10-20 компьютеров, в очень большой — порядка 1000. 124 Глава 4. Программно-технические системы реализации информационных процессов Назначение локальных сетей Хотя массовый характер создание локальных сетей приняло после появления персональных компьютеров, связь между компьютерами на небольших расстояниях суш;ествовала еш;е задолго до того. Одной из первых возникших в ходе развития вычислительной техники задач, потребовавшей создания сети хотя бы из двух компьютеров, явилось обеспечение большой надежности при управлении ответственным процессом в режиме реального времени. Так, при управлении запуском космического аппарата выход из строя управляюш;его компьютера грозит непоправимыми последствиями. Для повышения надежности системы управления используется дублируюгций компьютер. При сбое в работе активной машины содержимое ее процессора и ОЗУ очень быстро перебрасывается на вторую, которая подхватывает управление. Другой пример — присоединение к большим компьютерам второго-третьего поколений многочисленных терминалов — устройств ввода/вы-вода данных и программ. Эти терминалы практически никакой обработки информации не вели, но позволяли разделить машинное время мош;ного и дорогого компьютера между разными пользователями. Соответствуюпдий режим работы назывался режимом разделения времени, так как компьютер последовательно во времени решал задачи множества пользователей. Вскоре после появления в начале 1980-х годов персональных компьютеров их стали объединять в сети, что позволило совместно использовать файлы, базы данных и аппаратные ресурсы (например, принтеры). Сегодня локальные сети являются системами, требующими сложного технического и программного обслуживания. Компьютерные сети породили новые технологии обработки информации — сетевые технологии, позволяющие совместно использовать аппаратные и программные средства: накопители большой емкости, печатающие устройства, базы и банки данных. Для сотрудников многих учреждений стало привычным пользоваться электронной почтой для обмена сообщениями и документами, для совместной работы над проектами. В школах и вузах локальные сети помогают вести уроки, организовывать доступ к учебным ресурсам, библиотекам и т. д. На предприятиях на базе локальных сетей создаются автоматизированные системы управления предприятием и технологическими процессами. Аппаратные средства локальной сети Аппаратура локальной сети в общем случае включает в себя: • компьютеры (серверы и рабочие станции); • сетевые платы; • каналы связи; • специальные устройства, поддерживающие функционирование сети (маршрутизаторы, концентраторы, коммутаторы). Простейшим видом локальной сети является одноранговая сеть. Из названия такой сети следует, что все компьютеры в ней имеют одинаковую значимость (статус) и ни один из них не подчинен другому. § 22. Организация локальных сетей 125 Более развитые сети, помимо компьютеров конечных пользователей — рабочих станций, включают специальные компьютеры — серверы. Сервер — это выделенный в сети компьютер, выполняющий функции обслуживания рабочих станций. Есть разные виды серверов: файл-серверы, серверы баз данных и др. Например, компьютер, выполняющий функции файл-сервера, используется только для одной цели: обеспечивать пользователям доступ к аппаратным и программным ресурсам сервера, а не компьютеров друг друга, что улучшает защиту персональных данных. Каждый компьютер подключается к сети с помощью сетевой платы — адаптера, которая поддерживает конкретную схему подключения. Так, широко распространенными являются адаптеры Ethernet с пропускной способностью от 10 или 100 Мбит/с. К сетевой плате подключается сетевой кабель. Если используется радиосвязь или связь на инфракрасных лучах, то кабель не требуется. В современных локальных сетях чаще всего применяют два типа сетевых кабелей: • неэкранированная витая пара; • волоконно-оптический кабель. Витая пара представляет собой набор из восьми проводов, скрученных попарно таким образом, чтобы обеспечивать защиту от электромагнитных помех. Каждая витая пара соединяет с сетью только один компьютер, поэтому нарушение соединения сказывается только на этом компьютере, что позволяет быстро находить и устранять неисправности. Волоконно-оптические кабели передают данные в виде световых импульсов по стеклянным проводам. Большинство технологий локальных сетей в настоящее время позволяют использовать волоконно-оптические кабели. Волоконно-оптический кабель обладает существенными преимуществами по сравнению с любыми вариантами медного кабеля. Волоконно-оптические кабели обеспечивают наивысшую скорость передачи; они более надежны, так как не подвержены электромагнитным помехам. Оптический кабель очень тонок и гибок, что делает его транспортировку более удобной по сравнению с более тяжелым медным кабелем. Скорость передачи данных по оптическому кабелю составляет сотни тысяч мегабитов в секунду, что примерно в тысячу раз быстрее, чем по проводам витой пары. Беспроводная связь на радиоволнах может использоваться для организации сетей в пределах больших помещений там, где применение обычных линий связи затруднено или нецелесообразно. Кроме того, беспроводные линии могут связывать удаленные части локальной сети на расстояниях до 25 км (при условии прямой видимости). Совместно используемые внешние устройства включают в себя подключенные к серверу накопители внешней памяти, принтеры, графопостроители и другое оборудование, которое становится доступным с рабочих станций. Помимо кабелей и сетевых адаптеров, в локальных сетях на витой паре используются другие сетевые устройства — концентраторы, коммутаторы и маршрутизаторы. 126 Глава 4. Программно-технические системы реализации информационных процессов Концентратор (называемый также хаб) — устройство, объединяющее несколько (от 5 до 48) ветвей звездообразной локальной сети и передающее информационные пакеты во все ветви сети одинаково. Коммутатор (свич) делает то же самое, но, в отличие от концентратора, обеспечивает передачу пакетов в заданные ветви. Это обеспечивает оптимизацию потоков данных в сети и повышение защищенности от несанкционированного проникновения. Маршрутизатор (роутер) — устройство, выполняющее пересылку данных между двумя сетями, в том числе между локальными и глобальными сетями. Маршрутизатор, по сути, является специализированным микрокомпьютером, имеет собственный процессор, оперативную и постоянную память, операционную систему. Топологии сетей Локальные сети в зависимости от назначения и технических решений могут иметь различные конфигурации (топологии, архитектуры), изображенные на рис. 4.15. ^ .1 п Концен- тратор Г" < У с о 1« п Cl Шива zv ^ в г Рис. 4.15. Топологии локальных сетей: а — кольцевая, б — радиальная («звезда»), в — шинная, г — древовидная В кольцевой топологии информация передается по замкнутому каналу. Каждый абонент непосредственно связан с двумя ближайшими соседями, хотя в принципе способен связаться с любым абонентом сети. § 22. Организация локальных сетей 127 В радиальной топологии (топология «звезда») в центре находится концентратор, последовательно связывающийся с абонентами и связывающий их друг с другом. В шинной топологии компьютеры подключены к общему для них каналу (шине), через который могут обмениваться сообщениями. В древовидной топологии реализована иерархическая подчиненность компьютеров. Организация передачи данных в сети Необходимым условием работы единой локальной сети является использование сетевой операционной системы. Такие операционные системы обеспечивают совместное использование не только аппаратных ресурсов сети (принтеров, накопителей и т. д.), но и распределенных коллективных технологий при выполнении разнообразных работ. Наибольшее распространение получили сетевые операционные системы Novell NetWare, Linux и Windows. Информация в сетях передается отдельными порциями — пакетами, причем длина этих пакетов строго ограничена (обычно величиной в несколько килобайтов). Этот способ передачи связан с тем, что локальная сеть должна обеспечивать качественную связь для всех компьютеров сети за разумное время доступа — время ожидания пользователем начала связи. Естественно, оно не должно быть слишком большим. Поскольку в сетях наиболее распространенных конфигураций не может происходить несколько передач одновременно во избежание смешивания информации, то без разделения передаваемых данных на пакеты часть пользователей могла бы оказаться фактически отрезанной от сети. Таким образом, процесс информационного обмена в сети представляет собой циркуляцию пакетов, каждый из которых содержит данные (или часть данных), передаваемых от абонента к абоненту. Выше говорилось, что сети породили новые (сетевые) технологии обработки информации. Распространенный способ организации обработки информации в сети называется технологией «клиент—сервер». В ней предполагается глубокое разделение функций компьютеров в сети. При этом в функции клиента (рабочей станции) входит: • предоставление пользовательского интерфейса, ориентированного на нужды пользователя; • формирование запросов к серверу, причем не обязательно с информированием об этом пользователя; в идеале пользователь вообще не вникает в технологию общения своего компьютера с сервером; • анализ ответов сервера на запросы и предъявление их пользователю. Основная функция сервера — выполнение специфических действий по запросам клиента (например, решение сложной математической задачи, поиск данных в базе данных, соединение клиента с другим клиентом ИТ. д.). 128 Г лава 4. Программно-технические системы реализации информационных процессов Система основных понятий Организация локальных сетей Локальная сеть — объединение нескольких компьютеров, расположенных недалеко друг от друга, для совместной работы Устройства, входяш,ие в локальную сеть, и их функции: сервер — компьютер, обслуживающий рабочие станции рабочие станции — компьютеры, решающие прикладные задачи обработки информации каналы связи: витая пара, волоконно- оптический кабель, беспроводная связь дополнительные устройства: сетевые принтеры, сканеры, сетевые платы, концентраторы, коммутаторы, маршрутизаторы Конфигурации локальных сетей: Кольцевая Радиальная («звезда») Шинная Древовидная Основные функции сетевой операционной системы: Поддержка обмена информацией между рабочими станциями Защита программ и данных Совместное использование аппаратных ресурсов Вопросы И задания 1. Что такое компьютерная сеть? 2. Для чего создаются локальные компьютерные сети? 3. Что такое сервер? Рабочая станция? 4. Что такое сетевой адаптер? Концентратор? Коммутатор? Маршрутизатор? 5. Какие виды линий (каналов) используются для связи компьютеров в локальных сетях? 6. Какие бывают топологии локальных сетей? 7. Выясните, какие топологии локальных сетей используются в компьютерных классах вашей школы. 8. Каковы характерные черты технологий «клиент-сервер*? § 23. Организация глобальных сетей 129 Организация глобальных сетей История развития глобальных сетей Из истории человеческого общества вам должно быть известно, что многие научные открытия и изобретения сильно повлияли не ее ход, на развитие цивилизации. К их числу относятся изобретение парового двигателя, открытие электричества, овладение атомной энергией, изобретение радио и пр. Процессы резкого изменения в характере производства, в быту, к которым приводят важные научные открытия и изобретения, принято называть научно-технической революцией. Появление и развитие компьютерной техники во второй половине XX века стало важнейшим фактором научно-технической революции. В этом процессе выделим три этапа. Первый этап начался с создания первой электронно-вычислительной машины (ЭВМ) в 1945 году. Приблизительно в течение 30 лет компьютерами пользовалось сравнительно небольшое число людей, главным образом в научной и производственной областях. Второй этап начался в середине 70-х годов XX века и связан с появлением и распространением персональных компьютеров (ПК). ПК стали широко использоваться не только в науке и производстве, но и в системе образования, сфере обслуживания, быту. ПК вошли в дом как один из видов бытовой техники наряду с радиоприемниками, телевизорами, магнитофонами. Третий этап связан с появлением глобальной компьютерной сети Интернет. В результате персональный компьютер, который помещается на письменном столе, стал «окном» в огромный мир информации. Появились такие новые понятия, как «мировое информационное пространство», «киберпространство». Распространение Интернета решает важную социальную проблему информационного неравенства, которое существует между людьми, живущими в разных странах, на разных континентах, а также в крупных городах и на периферии. Именно развитие Интернета дает основание говорить о том, что в истории цивилизации наступает этап информационного общества. С распространением компьютеров возникает понятие компьютерной грамотности. Это необходимый уровень знаний и умений человека, позволяющий ему использовать компьютер для общественных и личных целей. На первом этапе развития ЭВМ компьютерная грамотность сводилась к умению программировать. Программирование главным образом изучалось в высших учебных заведениях, владели им ученые, инженеры, профессиональные программисты. На втором этапе под общим уровнем компьютерной грамотности стали понимать умение работать на персональном компьютере с прикладными 5-1415 130 Глава 4. Программно-технические системы реализации информационных процессов программами, выполнять минимум необходимых действий в среде операционной системы. Компьютерная грамотность на таком уровне становится массовым явлением благодаря обучению в школе, на многочисленных курсах, в самостоятельном режиме. На третьем, современном этапе важным элементом компьютерной грамотности стало умение использовать Интернет. Появилось более широкое понятие — информационная культура. Быстро растет число компьютеров, подключенных к мировой сети. И все более необходимым становится умение использовать компьютер для общения с другими людьми, для дистанционного обучения, поиска справочной информации, коммерческой деятельности и многого другого. Понятие глобальной сети — системы объединенных компьютеров, расположенных на больших расстояниях друг от друга, — появилось в процессе развития компьютерных сетей. В 1964 году в США была создана компьютерная система раннего оповещения о приближении ракет противника. Первой глобальной сетью невоенного назначения стала сеть ARPANET в США, введенная в действие в 1969 году. Она имела научное назначение и объединяла в себе компьютеры нескольких университетов страны. В 80-Х-90-Х годах прошлого века в разных странах создается множество отраслевых, региональных национальных компьютерных сетей. Их объединение в международную сеть произошло на базе межсетевой среды Интернет. Важным годом в истории Интернета стал 1993 год, когда была создана служба World Wide Web (WWW) — Всемирная информационная сеть (Всемирная паутина). С появлением WWW резко возрос интерес к Интернету, пошел процесс его бурного развития и распространения. Многие люди, говоря об Интернете, подразумевают именно WWW, хотя это только лишь одна из его служб. Интернет — это сложная аппаратно-программная система, в которой нам с вами предстоит разобраться. Постараемся полз^ить ответы на три вопроса: • из чего состоит Интернет; • как работает; • для чего используется. Часто в литературе вместо слова «Интернет» употребляют термин «Сеть» (уважительно с большой буквы). Мы также иногда будем им пользоваться. Аппаратные средства Интернета Основными составляющими любой глобальной сети являются компьютерные узлы и каналы связи. Здесь можно провести аналогию с телефонной сетью: узлами телефонной сети являются АТС — автоматические телефонные станции, которые между собой объединены линиями связи и образуют городскую телефонную сеть. Телефон каждого абонента подключается к определенной АТС. § 23. Организация глобальных сетей 131 К узлам компьютерной сети подключаются персональные компьютеры пользователей подобно тому, как с телефонными станциями соединяются телефоны абонентов. Причем в роли абонента компьютерной сети может выступать как отдельный человек через свой ПК, так и целая организация через свою локальную сеть. В последнем случае к узлу подключается сервер локальной сети. Организация, предоставляющая услуги обмена данными с сетевой средой, называется провайдером сетевых услуг. Английское слово «provider» обозначает «поставщик», «снабженец». Пользователь заключает договор с провайдером на подключение к его узлу и в дальнейшем оплачивает ему предоставляемые услуги (подобно тому, как мы оплачиваем услуги телефонной сети). Узел содержит один или несколько мощных компьютеров, которые находятся в состоянии постоянного подключения к сети. Информационные услуги обеспечиваются работой программ-серверов, установленных на узловых компьютерах. Каждый узловой компьютер имеет свой постоянный адрес в Интернете; он называется IP-адресом. IP-адрес состоит из четырех десятичных чисел, каждое в диапазоне от О до 255, которые записываются через точку. Например: 193.126.7.29 128.29.15.124 Такие же IP-адреса получают и компьютеры пользователей Сети, но они действуют лишь во время подключения пользователя к сети, т. е. изменяются в каждом новом сеансе связи, в то время как адреса узловых компьютеров остаются неизменными. Наряду с цифровыми IP-адресами в Интернете действует система символьных адресов, более удобная и понятная для пользователей. Она называется доменной системой имен (DNS — Domain Name System). Например, IP-адресу 195.34.32.11 сервера компании «МТУ-Интел» соответствует доменное имя dialup.mtu.ru. Данное имя состоит из трех доменов, разделенных точками. Система доменных имен построена по иерархическому принципу. Первый справа домен (его еще назывгпот суффиксом) — домен верхнего уровня, следующий за ним — домен второго уровня и т. д. Последний (первый слева) — имя компьютера. Домены верхнего уровня бывают географическими (двухбуквенными) или административными (трехбуквенными). Например, российской зоне Интернета принадлежит географический домен ru. Еще примеры: ик — домен Англии; са — домен Канады; de — домен Германии; jp — домен Японии. Административные домены верхнего уровня чаще всего относятся к американской зоне Интернета: gov — правительственная сеть США; mil — военная сеть; edu — образовательная сеть; сот — коммерческая сеть. 132 Глава 4. Программно-технические системы реализации информационных процессов Среди узлов Интернета есть своя иерархия. Например, некоторый узел в Самаре имеет соединение с узлом в Москве, который, в свою очередь, связан с рядом узлов европейской опорной сети. Последние имеют связь с узлами США, Японии и др. И все-таки структура Интернета — это не дерево, а именно сеть. Как правило, каждый узел имеет связь не с одним, а с множеством других узлов. Поэтому маршруты, по которым поступает информация на некоторый узел, могут быть самыми разными. Этим обеспечивается устойчивость работы Сети: при выходе из строя одного узла информационные потоки к другим узлам не прерываются. Они лишь могут изменить свои маршруты. Каналы связи Супцествуют самые разные технические способы связи в глобальной сети: • телефонные линии; • электрическая кабельная связь; • оптоволоконная кабельная связь; • радиосвязь (через радиорелейные линии, спутники связи). Различные каналы связи различаются тремя основными свойствами: пропускной способностью^ помехоустойчивостью, стоимостью. По параметру стоимости самыми дорогими являются оптоволоконные линии, самыми дешевыми — телефонные. Однако с уменьшением цены снижается и качество работы линии: уменьшается пропускная способность, сильнее влияют помехи. Практически не подвержены помехам оптоволоконные линии. Пропускная способность — это максимальная скорость передачи информации по каналу. Обычно она выражается в килобитах в секунду (Кбит/с) или в мегабитах в секунду (Мбит/с). Пропускная способность телефонных линий — десятки и сотни Кбит/с; пропускная способность оптоволоконных линий и линий радиосвязи измеряется десятками и сотнями Мбит/с. На протяжении многих лет большинство пользователей Сети подключались к узлу через коммутируемые (т. е. переключаемые) телефонные линии. Такое подключение производится с помощью специального устройства, которое называется модемом. Слово «модем» — это сокращенное объединение двух слов: «иеодулятор» — «^елюдулятор». Модем устанавливается как на компьютере пользователя, так и на узловом компьютере. Модем выполняет преобразование дискретного сигнала (выдаваемого компьютером) в непрерывный (аналоговый) сигнал (используемый в телефонной связи) и обратное преобразование. Основной характеристикой модема является предельная скорость передачи данных. В разных моделях она колеблется в диапазоне от 1200 бит/с до 56 000 бит/с. § 23. Организация глобальных сетей 133 Кабельная связь обычно используется на небольших расстояниях (между разными провайдерами в одном городе). На больших расстояниях выгоднее использовать радиосвязь. Все большее число пользователей в наше время переходят от коммутируемых низкоскоростных подключений к высокоскоростным некоммутируемым линиям связи. Программное обеспечение Интернета Работа Сети поддерживается определенным программным обеспечением (ПО). Это ПО функционирует на серверах и на персональных компьютерах пользователей. Как вам должно быть известно из базового курса информатики, основой всего программного обеспечения компьютера является операционная система, которая организует работу всех других программ. Программное обеспечение узловых компьютеров очень разнообразно. Условно его можно разделить на базовое (системное) и прикладное. Базовое ПО обеспечивает поддержку работы сети по протоколу TCP/IP — стандартному набору протоколов Интернета, т. е. оно решает проблемы рассылки и приема информации. Прикладное ПО занимается обслуживанием разнообразных информационных услуг Сети, которые принято называть службами Интернета. Служба объединяет серверы и клиентские программы, обменивающиеся данными по некоторым прикладным протоколам. Для каждой службы существует своя сервер-программа: для электронной почты, для телеконференций, для WWW и пр. Узловой компьютер выполняет функцию сервера определенной службы Интернета, если на нем работает сервер-программа этой службы. Один и тот же компьютер в разное время может выполнять функции сервера различных услуг; все зависит от того, какая сервер-программа на нем в данный момент выполняется. На ПК пользователей сети обслуживанием различных информационных услуг занимаются программы — клиенты. Примерами популярных клиент-программ являются: Outlook Express — клиент электронной почты, Internet Explorer — клиент службы WWW (браузер). Во время работы пользователя с определенной службой Интернета между его клиент-программой и соответствующей сервер-программой на узле устанавливается связь. Каждая из этих программ выполняет свою часть работы в предоставлении данной информационной услуги. Такой способ работы Сети называется технологией «клиент—сервер». Как работает Интернет В Интернете используется пакетная технология передачи информации. Чтобы в этом лучше разобраться, представьте себе следующую ситуацию. Вам нужно переслать товарищу в другой город какой-то многостраничный документ (например, распечатку романа, который вы сочинили). Полностью в конверт весь ваш роман не помещается, а посылать бандеролью вы не хотите — слишком долго будет идти. Тогда вы делите весь документ на части по 4 листа, вкладываете каждую часть в почтовый конверт, на каждом конверте пишете адрес и всю эту пачку конвертов опускаете в почтовый ящик. Например, если ваш роман занимает 100 страниц, то вам придется отправить 25 конвертов. Вы даже можете опустить кон- 134 Глава 4. Программно-технические системы реализации информационных процессов верты в разные почтовые ящики на разных узлах связи (для интереса, чтобы узнать, какие дойдут быстрее). Но поскольку на них указан один и тот же адрес, то все конверты должны дойти до вашего товарища. А еще, чтобы товарищу было удобно собрать роман целиком, на конвертах желательно указать порядковые номера. Аналогично работает пакетная передача информации в Интернете. За ее работу отвечает протокол TCP/IP, о котором уже говорилось раньше. Пора разобраться, что же обозначают эти загадочные буквы. Фактически речь идет о двух протоколах. Первый — ТСР-протокол расшифровывается так: Transmission Control Protocol — протокол управления передачей. Именно согласно этому протоколу всякое сообщение, которое нужно передать по Сети, разбивается на части. Эти части называются ТСР-пакетами. Для доставки пакеты передаются протоколу IP, который к каждому пакету дописывает IP-адрес его доставки и еще некоторую служебную информацию. Таким образом, ТСР-пакет — это аналог конверта с «кусочком» романа и адресом получателя. Каждый такой пакет будет самостоятельно перемещаться по сети независимо от других, но все они вместе соберутся у адресата. Далее, согласно протоколу TCP, происходит обратный процесс: из отдельных пакетов собирается исходное сообщение. Здесь, очевидно, необходимы те самые порядковые номера на конвертах; аналогичные номера содержатся и в ТСР-пакетах. Если какой-то из пакетов не дошел или был испорчен при транспортировке, его передача будет запрошена повторно. Согласно протоколу TCP, передаваемое сообщение разбивается на пакеты на отправляющем сервере и восстанавливается в исходном виде на принимающем сервере. Назначение IP-протокола (Internet Protocol) — доставка каждого отдельного пакета до места назначения. Пакеты передаются, как эстафетные палочки, от одного узла к другому. Причем маршруты для разных пакетов из одного и того же сообщения могут оказаться разными. Описанный механизм передачи пакетов отображен на рис. 4.16. Вопрос о маршруте решается отдельно для каждого пакета. Все зависит от того, куда его выгоднее передать в момент обработки. Если на каком-то участке Сети произошел «обрыв», то передача пакетов пойдет в обход этого участка. Таким образом, в любой момент времени по любому каналу Сети перемещается «вперемешку» множество пакетов из самых разных сообщений. Использование всякого канала связи стоит денег: междугородние, а тем более международные телефонные разговоры, достаточно дороги. Если бы, работая в Сети, вы в течение всего сеанса связи монопольно занимали международный канал, то расходы вас бы быстро разорили. Однако, согласно описанной технологии, канал вы делите с сотнями (а может — тысячами) других пользователей, и поэтому на вашу долю приходится лишь небольшая часть расходов. § 23. Организация глобальных сетей 135 Система основных понятий Организация глобальных сетей Глобальная сеть — система объединенных компьютеров, расположенных на больших расстояниях друг от друга. Создание Интернета — важнейший шаг к информационному обществу World Wide Web — Всемирная паутина — важнейшая служба Интернета Аппаратные средства Интернета Программное обеспечение Интернета Компьютерные узлы Каналы связи: телефонные, оптоволоконные, радио, спутниковые и др. Системные: протокол TCP, протокол IP Прикладные: программы электронной почты, телеконференций, поиска в WWW идр. Система адресации в Интернете: 1Р-адреса и доменные имена Вопросы и задания 1. Обоснуйте, почему создание и развитие компьютерной техники можно отнести к важнейшим факторам научно-технической революции XX столетия. 2. Какие технические и социальные проблемы решаются средствами глобальных компьютерных сетей? 3. Что такое глобальная сеть? Что такое Интернет? 4. Как с развитием компьютерной техники изменялось представление о компьютерной грамотности? 136 Глава 4. Программно-технические системы реализации информационных процессов 5. Попробуйте предсказать последствия для человечества дальнейшего развития компьютерной техники и глобальных сетей. 6. Чем отличается узловой компьютер от ПК пользователя сети? Обозначьте разницу по следующим позициям: назначение, режим работы, программное обеспечение. 7. Что обозначает слово «сервер» в сетевых технологиях? 8. Что такое IP-адрес и доменный адрес? 9. Сопоставьте различные типы каналов связи по двум их свойствам: цена и качество. 10. Для чего используется модем? 11. Как проявляется технология «клиент-сервер» в организации работы Сети? 12. Объясните, почему пакетный принцип передачи информации способствует повышению надежности работы Сети? 13. В чем разница назначения протоколов TCP и IP? 14. Объясните, почему международная связь по сети Интернет дешевле телефонной или телеграфной связи. Глава 5________________________ Технологии использования и разработки информационных систем Понятие информационной системы (ИС), классификация ИС Назначение информационных систем Содержание данной главы посвящено одной из важнейших прикладных областей информатики — информационным системам. В широком смысле информационной системой можно назвать любую организационную структуру, задача которой состоит в работе с информацией, например библиотеку, справочную службу железных дорог, учреждение СМИ (редакцию газеты, телецентр, радиостудию). В этом смысле информационными системами являются все подразделения управленческой структуры предприятия: бухгалтерия, отдел кадров, отдел научно-технической информации и пр. Примеры можно продолжить. Все эти службы существовали и до появления компьютеров, существуют и сейчас. Разница в том, что раньше они использовали «бумажные» технологии работы с информацией, простые средства механизации обработки данных, а сейчас все шире применяют компьютеры. В основе любой информационной системы лежит структурированный набор данных — структура данных (рис. 5.1). Для обеспечения функционирования ИС должны существовать средства поддержки, которые делятся на системные и пользовательские. Назначение системных средств — обеспечение сохранности данных, их обновления и защиты. Назначение пользовательских средств (приложений) — обеспечение удобства работы конечных пользователей, т. е. тех людей, в интересах которых создана информационная система. В дальнейшем речь будет идти о компьютерных информационных системах. 138 Глава 5. Технологии использования и разработки информационных систем ИНФОРМАЦИОННАЯ СИСТЕМА Пользовательские средства (приложения) Системные средства СТРУКТУРА ДАННЫХ Рис. 5.1. Состав информационной системы Информационная система (ИС) — это система, построенная на базе компьютерной техники, предназначенная для хранения, поиска, обработки и передачи значительных объемов информации, имеющая определенную практическую сферу применения. Пример использования информационной системы Для иллюстрации практической сферы применения ИС вернемся к примеру с приемом абитуриентов в университет, который уже затрагивался в § 15. Всю работу по организации приема осуществляет подразделение вуза, которое называется «Приемная комиссия». На рис. 5.2 в схематическом виде показано место информационной системы в работе приемной комиссии. Рис. 5.2. Состав и структура системы «Приемная кампания в университете* Весь процесс приема в университет рассматривается как система под названием «Приемная кампания в университет». Ее подсистемами являются «Приемная комиссия» и «Абитуриенты». Информационная система является подсистемой приемной комиссии. Основная функция информационной системы — обеспечить хранение и оперативную обработку всей поступающей информации в ходе приемной кампании, а также подготовку документов: списков, справок, ведомостей, отчетов и пр. В прежние времена вся эта рутинная работа выпол- § 24. Понятие информационной системы (ИС), классификация ИС 139 нялась вручную, теперь ее практически во всех вузах выполняют с по-мопдью компьютерных информационных систем. Отметим, что информационная система «сама» никаких решений о зачислении в вуз не принимает. Она лишь содействует в этом членам приемной комиссии. Классификация ИС по техническим средствам Многочисленные и разнообразные информационные системы, которые существуют сегодня, можно классифицировать по разным признакам. Первый признак классификации — по использованию технических средств. Простейшая ИС работает на одном компьютере. Вся информация сосредоточена в памяти этой машины, и на ней же функционирует все программное обеспечение системы. Другой вариант — ИС на базе локальной сети. Обычно это информационные системы, обслуживающие учреждение, предприятие, фирму. В такой системе циркулирующая информация может передаваться по сети между разными пользователями; разные части общедоступных данных могут храниться на разных компьютерах сети. И наконец, третий вариант — это ИС^ существующие на базе глобальных компьютерных сетей. Все известные вам службы Интернета можно рассматривать как таковые. Наиболее масштабной из них является World Wide Web. Однако существует множество глобальных информационных систем не общего, а ограниченного доступа и масштаба — это корпоративные системы. Они могут объединять между собой локальные сети предприятий одного ведомства и способствовать их общему эффективному управлению в рамках региона, министерства и пр. Если вам приходилось покупать железнодорожные или авиабилеты на дальние расстояния, то, значит, вы пользовались услугами транспортной информационной системы, работающей на базе специализированной глобальной сети. Классификация ИС по назначению Теперь рассмотрим другой принцип классификации информационных систем — по назначению, т. е. по выполняемым функциям. Наиболее старым и традиционным видом ИС являются информационно-справочные или информационно-поисковые системы (ИПС)-. Основная цель в использовании таких систем — оперативное получение ответов на запросы пользователей в диалоговом режиме. Характерным свойством для ИПС является большой объем хранимых данных, их постоянная обновляемость. Обычно пользователь желает быстро получить ответ на свой запрос, поэтому качество системы во многом определяется скоростью поиска данных и выдачи ответа. При работе ИПС не используются сложные методы обработки данных. Хранилище информации, с которой работает ИПС, называется базой данных. Примером справочной системы является ИПС крупной библиотеки, позволяющая определить наличие в библиотеке нужной книги или произвести подборку литературы по заданной тематике. Поисковые серверы Интернета — это информационно-справочные системы сетевых ресурсов. 140 Глава 5. Технологии использования и разработки информационных систем Другой ТИП информационных систем — управляющие системы. Основное назначение таких систем — выработка управляющих решений. Управляющие системы бывают либо полностью автоматическими, либо автоматизированными. Системы автоматического управления (САУ) работают без участия человека. Это системы управления техническими устройствами, производственными установками, технологическими процессами. Например, САУ используются для управления работой ускорителей элементарных частиц в физических лабораториях, работой химического реактора или автоматической линией на производственном предприятии. В таких системах реализована кибернетическая схема управления с обратной связью, приведенная на рис. 2.3 в § 6. Роль системы управления выполняет компьютер, который работает по программе, составленной программистами. Управление в САУ происходит в режиме реального времени. Это значит, что управляющие команды должны вырабатываться синхронно с управляемым физическим процессом. Поэтому с ростом скорости работы управляемого объекта должно повышаться быстродействие управляющего компьютера. Автоматизированные системы управления (АСУ) можно назвать человеко-машинными системами. В них компьютер выступает в роли помощника человека-управляющего. В АСУ задача компьютера состоит в оперативном предоставлении человеку необходимой информации для принятия решения. При этом компьютер может выполнять достаточно сложную обработку данных на основании заложенных в него математических моделей. Это могут быть технологические или экономические расчеты. Конечно, в АСУ тоже имеются ограничения на время получения ответа от компьютера на запросы пользователей. По эти ограничения не такие жесткие, как в автоматических системах. Часто в автоматизированных системах управления в качестве подсистемы присутствуют ИПС. Крупные АСУ обеспечивают управление предприятиями, энергосистемами и даже целыми отраслями производства. Еще одним видом информационных систем являются обучающие системы на базе компьютера. Простейший вариант такой системы — обучающая программа на ПК, с которой пользователь работает в индивидуальном режиме. Существует множество таких программ практически по всем школьным предметам и ряду курсов профессионального обучения. Более сложными являются системы, использующие возможности компьютерных сетей. В локальной сети можно организовывать обучение с элементами взаимодействия учащихся, используя соревновательную форму или форму деловой игры. Наиболее сложными и масштабными обучающими системами являются системы дистанционного обучения, работающие в глобальных сетях. § 24. Понятие информационной системы (ИС), классификация ИС 141 Дистанционное образование называют образованием XXI века. Уже существуют дистанционные отделения при многих ведущих вузах страны, формируется международная система дистанционного образования. Такие системы открывают доступ к качественному образованию для всех людей, независимо от их места жительства, возраста, возможных физических ограничений. Высокоскоростные системы связи в сочетании с технологией мультимедиа позволяют организовывать обучение в режиме реального времени (on line), проводить дистанционные лекции, семинары, конференции, принимать зачеты и экзамены. И наконец, уделим внимание экспертным системам — основанным на моделях знаний в определенных предметных областях. Экспертные системы относятся к разделу информатики, который называется «Искусственный интеллект». Экспертная система заключает в себе знания высококвалифицированного специалиста в определенной предметной области и используется для консультаций пользователя, для помощи в принятии сложных решений, для решения плохо формализуемых задач. Примерами проблем, которые решаются с помощью экспертных систем, являются: установление диагноза больного; определение причин неисправности сложной техники (например, космического корабля); рекомендации по ликвидации неисправности; определение вероятных последствий принятого управляющего решения и т. д. Подобно ИПС, экспертные системы часто входят в состав АСУ в качестве подсистем. Список рассмотренных нами информационных систем далеко не полный. В § 30 будет рассказано о геоинформационых системах (ГИС). Существуют еще автоматизированные системы научных исследований (АСНИ), системы автоматизации проектирования (САПР) и другие. Описывать все подробно в рамках школьного учебника не представляется возможным. Вопросы и задания 1. Какие можно выделить основные признаки современной информационной системы? 2. К каким типам ИС относятся, например, такие системы: • система прогноза погоды для различных регионов страны; • система управления беспилотным космическим кораблем; • система диспетчерской службы крупного аэропорта; • система диагностики в кардиологической клинике? 3. Придумайте возможные области использования информационных систем в деятельности школы. К каким типам ИС относится каждая из придуманных вами систем? 142 Глава 5. Технологии использования и разработки информационных систем Система основных понятий Информационные системы Назначение ИС Состав ИС Хранение, поиск, обработка, передача больших объемов информации для определенной области применения Структура данных Средства системного обеспечения Средства прикладного обеспечения Области приложения Техническая база Справочно- Управлен- Обучение На одном компьютере На базе ком- информаци- ческая. и др. пьютерной онная принятие сети (локаль- решений ной или глобальной) Разновидности информационных систем ипс — САУ — АСУ — ГИС — ЭС — Системы информаци- системы авто- автоматизи- геоинфор- экспертные обучения онно- матического рованные мацион- системы и др. поисковые управления системы ные системы управления системы Компьютерный текстовый документ как структура данных с давних времен и до наших дней важнейшим источником знаний для людей были и остаются книги. Текст книги имеет определенную структуру. Он делится на части, главы, параграфы, разделы. Наличие структуры помогает читателю сориентироваться в содержании издания, быстро найти в нем нужные сведения. В начале или в конце книги помещается содержание (оглавление), где указываются заголовки разделов и ссылки на начальные страницы этих разделов. Еще одним средством поиска информации в книгах являются предметные указатели. Предметные указатели чаще всего используются в учебной литературе. В них помещаются основные термины текста в ал- § 25. Компьютерный текстовый документ как структура данных 143 фавитном порядке и даются ссылки на страницы книги, где эти понятия раскрываются или используются. Для того чтобы читатель нашел нужное место в тексте книги, он должен путем перелистывания страниц добраться до той страницы, на которую указывает ссылка. Есть еще один тип ссылок, применяемых в бумажных изданиях: ссылки на внешние источники информации: книги, статьи в периодических изданиях, статьи законодательства, государственные документы и пр. Они задаются либо в сносках на той же странице, к фрагменту текста которой дается ссылка, либо путем указания номера записи в списке литературы, приводимом в конце книги. По такой ссылке вы ищете соответствующее издание в своей домашней библиотеке или в публичной библиотеке, возможно, книжном магазине. Методика ссылок используется и в электронных (цифровых) текстах и документах. Однако она качественно отличается от той, что описана выше: такие ссылки позволяют читателю мгновенно переходить к нужному разделу или любому фрагменту текста и даже к внешним источникам информации, если они хранятся в цифровой форме на данном компьютере или на других компьютерах, доступных по сетевой связи. Такие ссылки называют гиперссылками. Текст (документ), имеющий структуру, реализованную с помощью гиперссылок, будем называть гипертекстом. Благодаря использованию механизма ссылок, документ, созданный, например, в текстовом процессоре и открытый в среде текстового процессора, можно сделать основой несложной информационной системы, превратив его в структуру данных. Использование оглавлений и указателей Рассмотрим пример создания информационной системы с помощью текстового процессора Microsoft Word. Требуется создать дневник студента, в котором будут храниться разнообразные сведения, необходимые студенту в процессе учебы. К таким сведениям могут относиться: расписание занятий и информация по изучаемым дисциплинам. По каждой дисциплине будут представлены: программа курса, рекомендуемая литература, содержание экзаменационных билетов. Сюда же можно будет занести конспекты лекций, сведения о текущей успеваемости и другую полезную информацию. Универсальным решением такой задачи является построение базы данных средствами некоторой СУБД — системы управления базами данных. Однако если не выдвигать завышенных требований к системе, то можно обойтись и гиперструктурой, построенной с помощью Word. Такой документ должен начинаться с оглавления. Каждый пункт оглавления должен представлять собой гиперссылку на соответствующий раздел документа. Однако «своими руками» делать оглавление совсем не обязательно. Word может создать его автоматически. Опишем, как это делается. 144 Глава 5. Технологии использования и разработки информационных систем Начинаем с формирования первой страницы дневника, как это показано на рис. 5.3. •« mem’ ■rr OgMI «1 ;■ № • П® UO' • © r 4 . Ш H ge ■ l=tdtix[^^- » n^l№ » €> о ’ о ’ J" .> S. t i ь ■■■ ' • I 1^ ■ ' 1 IH •' t ^ • i IT ^iri 3 J l* ' I* ' I* Расписание занятий Понедельник .«МММ Др«м Др€ЛЫ4Ш Bmi гвмятий ДреяеЗеежшм» 1 •«•-9-35 Фтхткя Лсшаа 902 Швм Л-П- 2 9-45-11-20 Лспщшт Сейма» 324 КюмаИТ. 3 11-30-13-05 Фяик1 Лаб. работы 111 Нгатваа Е.Ю. m аШ» «1 li E«fc. . •_ •;!. ■_ Cl» 1 ЧМI Ч M* cr u №} ; ncn^r* CX . I 1 I 1 е>В>и4 Л&1Л ** lyaaawt-bfc-.ICfiiMiljfci-.. Iftri—ct»_ H !^i««i« C»i ■ I W t Щ ‘ЬфКфё n.« < Рис. 5.3. Первая страница дневника Далее форматируем строку «Расписание занятий» как заголовок первого уровня, действуя по следующему алгоритму: 1) выделить строку; 2) выполнить команду Формат, Стили и форматирование; 3) в открывшемся окне выбрать стиль Заголовок 1 (заголовок первого уровня). Далее выделим строку со словом «Понедельник» и назначим ей стиль Заголовок 2 (заголовок второго уровня). На следующей странице, где помещается расписание на вторник, слову «Вторник» назначим стиль Заголовок 2. И т. д. При вводе раздела «Читаемые курсы», его заголовку назначается стиль Заголовок 1. Заголовкам подразделов «Физика», «Математика», «История» и др. назначается стиль Заголовок 2. Заголовкам подразделов «Учебная программа», «Учебная литература», «Экзаменационные билеты» назначается стиль Заголовок 3 (заголовки третьего уровня). Полезно пронумеровать страницы всего документа командой Вставка, Номера страниц. § 25. Компьютерный текстовый документ как структура данных 145 После этого можно создавать оглавление. Делается это следующим образом: 1) установить курсор на позицию в тексте, куда следует поместить оглавление. (Перед этим можно ввести слово «Оглавление», а в следующую строку поставить курсор.) 2) выполнить команду Вставка, Ссылка, Оглавления и указатели. Выбрав подходящие режимы в диалоговом окне (или приняв предлагаемые), щелкнуть на кнопке ОК. То, что вы увидите, показано на рис. 5.4. епв •«Ь •• Сттк Ом 0мм, □ C# У Л а Ч- в j3@] • О Т 4 тм.н»М«г Nww. О © i> ' J * t> 9 . . к в А а ■ )= в » W а • ^ • II Or.lARlEHIIE Расписание занятий.................... Понедельник................................. Вторник..................................... Среда. ...........................................3 ...........................................3 Четверг................................................6 Пятница................................................7 Суббота................................................8 Читаемые курсы...........................................9 Физика..................................................9 Учебная программа.....................................9 ^'чебная литература...................................9 Экзаменационные билеты................................9 Математика............................................10 Учебная программа................................... 10 Учебная литсратл-ра................................ 10 Экзаменационные билеты..............................10 История...............................................11 Ш 4] Ctp. 1 шл t » "И ^ 0 Ci ' л;а *• .4;д.-» “ S■ . на 17^» с» М '«,• 1 .*■■» ri,- рива*^ вУ И1Г|1Ш»^ас-.. I Bl>a»a2-l. 3VJCeprftesiA.C б когшп We'W.hUT-? Д:Ч» f.itfVM с ■■StAaetwe Ссрыт«1Н liy Jita -,r •, 1 ьма Пр»глаша«4е| р-г- j ж ^ :з Уважаемый Андрей Сергеевич! Приглашаем Вас принять участие в работе конференции. Ваш доклад назначен на 15 декабря в 10 часов. С уважением. Оргкомитет. Г‘ Л I Рис. 5.10. Окно почтовой программы Из схемы на рис. 5.9 видно, что сервер и клиент работают по разным протоколам. Безусловно, «язык» у них общий и они «понимают» друг друга. Но функции отличаются. POP3 (Post Office Protocol — протокол почтового отделения), кроме прочего, выполняет функцию защиты информации. Во время сеанса связи он устанавливает личность пользователя, обеспечивает связь с его персональным ящиком. Задача клиент-про-граммы — передать на сервер исходящие письма и принять поступившие. 152 Глава 5. Технологии использования и разработки информационных систем Здесь используется более простой протокол SMTP (Simple Mail Transfer Protocol — простейший протокол передачи почты). Служба телеконференций, другое название — списки рассылки. Это тоже организация почтовой переписки. Но если по электронной почте вы отправляете свое письмо какому-то одному лицу персонально, то в телеконференции письмо направляется одновременно всем ее участникам. В свою очередь, все сообш;ения, которые поступают в адрес конференции, будут поступать в ваш почтовый яш;ик и загружаться в компьютер во время сеанса связи. Чтобы стать участником конференции, на нее нужно подписаться. Для этих целей суш;ествуют определенные адреса. Телеконференция всегда посвящается определенной теме, поэтому переписка в ней происходит только в рамках темы. Телеконференция объединяет в себе как коммуникационную, так и информационную функции. С одной стороны, здесь происходит личностное общение, с другой — материгшы конференции содержат большой объем полезной информации, которая определенное время хранится на сервере и может рассматриваться как некоторый информационный ресурс (электронная газета). Это особенно важно для специалистов, участвующих в конференциях по профессиональным тематикам, таким как наука, производство, бизнес, торговля и пр. В материалах конференции можно найти ценные советы, консультации, которые помогут в принятии важных решений. Форумы прямого общения — IRC (Internet Relay Chat). В буквальном переводе — «болтовня» в режиме реального времени (chat-конференции). Общение между участниками происходит в режиме on-line в письменной форме. Так же как в телеконференции, участники chat-конференции делятся по тематическим группам. На компьютере-сервере работает chat-сервер, на ПК пользователя — chat-клиент. Существует множество различных программ-клиентов, которые распространяются бесплатно через Интернет. Этой службой больше всего увлекаются молодые люди. Общение в чате они превращают в своеобразную игру, в которой каждый участник зачастую придумывает для себя какой-то образ и обыгрывает его. Впрочем, chat-службой можно воспользоваться и для серьезного общения, как коллективного, так и один на один. Интернет-телефония — голосовое общение через Сеть в режиме online. Это новая, развивающаяся служба. Ее основное преимущество перед телефоном — низкая цена. Качество пока уступает телефонной связи (задержки во времени, искажение звука), однако нет сомнений, что со временем этот недостаток будет преодолен. Информационные службы Интернета Информационные службы предоставляют пользователям возможность доступа к определенным информационным ресурсам, хранящимся в Интернете. Такими ресурсами являются либо файлы стандартных форма- § 26. Интернет как глобальная информационная система 153 тов, либо разного рода документы, которые можно просмотреть, распечатать, сохранить. Служба передачи файлов. Часто эту службу называют по имени используемого протокола: FTP (File Transfer Protocol — протокол передачи файлов). Со стороны Сети работу службы обеспечивают FTP-серверы, а со стороны пользователей — FTP-клиенты. Назначение FTP-сервера — хранение набора файлов самого разнообразного назначения (обычно в заархивированном виде). Чаще всего это программные файлы: средства системного и прикладного программного обеспечения. Но в наборах могут храниться файлы и любых других форматов: графические, звуковые, текстовые документы, файлы электронных таблиц и пр. Вся эта информация образует иерархическую структуру папок (каталогов и подкатгшогов). После соединения FTP-клиента с сервером на экране пользователя открывается файловый интерфейс хранилища папок и файлов на сервере (наподобие Проводника Windows). Далее работа происходит так же, как с файловой системой на вашем ПК: папки и файлы можно просматривать, сортировать, копировать на свои диски. Клиент FTP входит в состав программы Internet Explorer и поэтому всегда имеется на ПК, работающем под управлением Microsoft Windows. World Wide Web (WWW, Всемирная паутина) — самая массовая сегодня информационная служба Интернета. Это огромная, распределенная по всему миру информационная система, содержащая миллионы документов на самые разнообразные темы. Работает эта служба на базе протокола HTTP. Подробно о WWW будет рассказано в следующем параграфе. О популярности WWW говорят такие данные: с момента создания Интернета (1969 г.) до появления WWW (1993 г.) к услугам Сети подключились около 2 миллионов пользователей; с появлением WWW за 5—7 лет это число увеличилось приблизительно до 200 миллионов человек. Система основных понятий Интернет — глобальная информационная система Службы Интернета построены по технологии «клиент-сервер* Коммуникационные службы Информационные службы Электронная почта — e-mail Телекон- ференции Форумы прямого общения — Chat Интернет- телефония Передача файлов WWW- Всемирная паутина Протоколы POP3, SMTP Почтовый сервер, почтовый клиент Протокол FTP Протокол HTTP 154 Глава 5. Технологии использования и разработки информационных систем Вопросы и задания 1. Объясните различие между коммуникационными и информационными службами Сети. 2. Объясните различие между понятиями «базовый протокол Интернета» и «прикладные протоколы». 3. Почему сервер и клиент электронной почты используют разные протоколы? 4. Чем отличается chat-конференция от телеконференции? 5. В чем преимущество Интернет-телефонии по сравнению с традиционной телефонной связью? 6. Для каких целей используется FTP-служба? 7. Какое значение для развития Интернета имело появление службы WWW? World Wide Web Всемирная паутина Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как Всемирная паутина. Каждый может представить себе паутину — сеть, которую плетет паук. В рассматриваемом контексте исторически термин «сеть» закрепился за понятием «система взаимосвязанных компьютеров» (т. е. техническая система)^ а термин «паутина» (Web) — за понятием «система взаимосвязанных документов» (т. е. структура данных). Разумеется, «паутина» документов суш;ествует на базе компьютерной сети. Всемирная паутина (World Wide Web, WWW) — это система (сеть) документов, связанных между собой гиперссылками. Каждый отдельный документ, имеюш;ий собственный адрес, называется Web-страницей. Каждая Web-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 5.11 схематически показано «наложение» паутины документов на компьютерную сеть. Сплошными линиями обозначены Web-серверы и связи между ними, пунктирными — Web-документы и их связи. Web-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся Web-страницы. В доменном имени Web-сервера младший домен обычно обозначается как www. § 27. World Wide Web — Всемирная паутина 155 Рис. 5.11. Компьютерная Сеть и «паутина» документов Например: WWW .psu.ru — Web-сервер узла Интернета Пермского государственного университета. WWW. 1 septembeг. ru — Web-сервер газеты «Первое сентября». Web-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html. Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в «паутине». Обычно изображение гиперссылки каким-то образом выделяется на странице, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указываюш,им пальцем. Если при этом щ,елкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Протокол, который используется службой WWW, называется HTTP (HiperText Transfer Protocol — протокол передачи гипертекста). Его основное назначение — обработка гиперссылок, поиск и передача документов клиенту. Web-сайт — это совокупность взаимосвязанных (обычно тематически) страниц. Сайт принадлежит некоторому лицу или учреждению. Web-сайт организуется на Web-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являюпдуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные разделы сайта. Пример главной страницы Web-узла ПГУ приведен на рис. 5.12. URL-адрес. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса. В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурсов. Каждая Web-страница или файл имеют свой уникальный URL-адрес, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь) на сервере. Например, URL-адрес главной страницы Web-сайта газеты «Первое сентября» выглядит так: https://www.1September.ru/ru/first.htm Здесь https:// — протокол доступа; WWW. 1 September. ru — имя сервера; /ru/first.htm — полное имя файла. 156 Глава 5. Технологии использования и разработки информационных систем J “Л ■ 1М I Рис. 5.12. Фрагмент главной страницы Web-сайта ПГУ Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows, вместо символа «\» (обратный слэш) здесь используется символ «/» (прямой слэш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми. Web-браузер — клиент-программа WWW. Слово «browser» можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator компании Netscape Communications и Internet Explorer компании Microsoft. Система основных понятий World Wide Web Структурные составляющие Web-страница Web-сайт (узел ) HTML-файл URL-адрес Владелец сайта Главная страница Технология «клиент-сервер» реализуется через Web-сервер, Web-клиент, протокол HTTP Web-браузер — клиент-программа WWW § 28. Средства поиска данных в Интернете 157 Вопросы и задания 1. Каково смысловое различие терминов «сеть» и «паутина* в контексте системы компьютерных коммуникаций? 2. Что является наименьшей адресуемой единицей информации в WWW? 3. Сопоставьте структуру полного имени файла (адреса файла) на автономном компьютере и URL-адрес в сети. Отметьте сходство и различие. 4. Представьте себе, что вы проектируете сайт своей школы. Какую информацию вы бы поместили на главной странице? Средства поиска данных в Интернете Как уже говорилось выше, WWW — это система Web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система Web-страниц не структурирована. Единственной координатой Web-документа является его URL-адрес. Однако URL-адрес никак не связан с содержанием документа. Но поиск данных производится именно по содержанию. Как же он осуществляется? В поиске информации в WWW пользователю помогает поисковая служба Интернета. Поисковая служба основана на услугах поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели. Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные каталоги и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг. Систематизация в предметном каталоге производится по иерархическому принципу: на первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего образования, среднего образования, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога. Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о 158 Глава 5. Технологии использования и разработки информационных систем книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой, т. е. ссылкой на внутренний документ сайта, поискового катгшога. Щелчок мышью на гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, что такая система подобна дереву файловой системы ОС. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые Web-документы. Поисковые каталоги заполняются вручную специалистами, поддерживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые катгшоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов. Примерами поисковых каталогов являются: зарубежные: Yahoo! — WWW.yahoo.com The Virtual Library — www. w3 . org Magellan — www. me kin ley. com WebCrawler — www. webcrawler. com российские: Атрус — www.atrus.ru Ay! — WWW .au.ru List-Ru — WWW .list.ru Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели (о них было сказано выше). Например, найдите в предметном указателе этого учебника по информатике словосочетание «информационная система». Затем на страницах, номера которых указаны после этого словосочетания, вы можете прочитать все, что написано про информационные системы. Принцип работы поисковых указателей заключается в создании и использовании индексных списков — ангшогов книжных предметных указателей. Задачи поисковых машин состоят в формировании индексных списков, так чтобы охватить ими как можно большее число документов «паутины», а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически. Основной составляющей поисковых машин являются программы просмотра Web-доку ментов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим является название «пауки», если уж сеть WWW называть «паутиной»! Непрерывно, днем и ночью, они сканируют все информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором § 28. Средства поиска данных в Интернете 159 ОНО присутствует. Этот процесс не прерывается, поскольку содержание паутины все время меняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина все время должна поддерживать информацию в актуальном состоянии. Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы являются интеллектуальной собственностью их авторов и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска. В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенных по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка. Число поисковых указателей превышает число поисковых каталогов. Популярными указателями являются: зарубежные: Alta Vista — www. altavista. com Inktomi — WWW. inktomi . com Hot Bot — WWW.hotbot.com Lycos — WWW. lycos . com Fast Search — www. alltheweb. com Northern Light — www.northernlight. com российские: Апорт 2000 — WWW. aport. ru Рамблер — WWW.rambler.ru Hndex — WWW. yandex . ru Система основных понятий Поисковая служба Интернета Поисковые каталоги Поисковые указатели Накопление и систематизация информации о ресурсах Способы поиска ресурсов пользователем Накопление и система тизация информации о ресурсах Способы поиска ресурсов пользователем Иерархический предметный каталог. Формируется вручную силами экспертов Спуск по дереву каталога. Запросы по ключевым словам Индексные списки (предметные указатели). Формируются автоматически (роботами и пр.) Запросы по ключевым словам Вопросы И задания 1. Обоснуйте необходимость существования поисковых служб в Интернете. 2. В чем различие между поисковыми каталогами и поисковыми указателями? 3. Какую работу выполняют роботы (пауки) поисковых машин? 160 Глава 5. Технологии использования и разработки информационных систем Web-сайт — гиперструктура данных Публикации в Интернете Умение создавать Web-сайты становится все более актуальным навыком пользователя Интернета. Опубликовать сайт в Интернете настолько просто и доступно (по сравнению с публикациями в «бумажных» изданиях), что эта возможность привлекает все большее число людей. Сайты могут быть частными, а могут — официальными — производственными. Практически отсутствуют какие-либо ограничения на тематику сайтов; в Интернете нет цензуры. Однако Web-сайт, как и всякая публикация, может привлечь к себе внимание лишь в том случае, если его содержание несет какой-то обш;ественный интерес и если он имеет привлекательное внешнее оформление. Нередко разработчики Web-сайтов гораздо больше уделяют внимания внешнему оформлению страниц, чем их содержанию. Оформление Web-страниц становится своеобразным видом прикладного искусства. У него даже появилось свое название — Web-дизайн. Однако каким бы хорошим Web-художником вы ни стали, соблюдайте золотое правило: Если вам нечего сказать миру, не стоит засорять Сеть! Если же вы все-таки решились публиковаться в Интернете, то первый вопрос, в котором следует разобраться, — как и какими средствами создаются Web-страницы. Средства создания Web-страниц Как сконструировать Web-страницу с ее текстами, рисунками, шрифтовым, цветовым и звуковым оформлением? Надо создать текстовый файл, содержаш;ий описание страницы на языке HTML — (HiperText Markup Language — язык разметки гипертекста). Это можно сделать с помощью простых текстовых редакторов, например Блокнота в операци-^ онной системе Windows. Программирование на языке HTML — наиболее сложный способ Web-дизайна. Для создания Web-страниц существует также целый ряд инструментальных средств высокого уровня, которые называются HTML-редакторами. Работа с ними не требует знаний языка HTML, поэтому гораздо проще и эффективнее. Такие редакторы входят в состав популярных браузеров: Frontpage Express входит в Microsoft Internet Explorer; Netscape Composer — в Netscape Communicator. Мощными системами разработки сайтов являются, например, Microsoft FrontPage, Macromedia Dreamweawer. Фирма Microsoft включает средства создания Web-страниц в текстовый процессор Word, начиная с версии Word 97. Возможности такого Web-мастера ограничены, однако несложные сайты с его помощью вполне можно § 29. Web-сайт — гиперструктура данных 161 создавать. Web-мастер Word предоставляет пользователю набор шаблонов художественного оформления страниц. Впрочем, шаблонами можно и не пользоваться, а создавать свой дизайн и свою структуру документов. Проектирование Web-сайта Рассмотрим проект небольшого Web-сайта на конкретном примере. На рис. 5.13 приведена главная страница личного сайта семьи Смирновых. ч [Ь»вгл в>« Песжм £грм Л" с аЬ.^ Ыаг*| д а ^ Лма. Иэбр«НС^ По знакомы есь с семьей Смирновых ! Здесь вся наша семья: папа - Николай Петрович, мама - Ирина Борисовна, я - Сережа, пес Тимка. Подробности смотрите на других страницах сайта. [Пана] [Мама] [Сережа] [Тимка] Рис. 5.13. Окно браузера с главной страницей семейного сайта Приведенная главная страница является лишь корнем дерева, которое образуют взаимосвязанные страницы сайта. Вначале желательно спроектировать всю систему будупдего сайта, т. е. нарисовать схему, в которой отразить структуру связанных Web-страниц. В нашем случае получится схема, приведенная на рис. 5.14. Рис. 5.14. Структура семейного сайта 6-1415 162 Глава 5. Технологии использования и разработки информационных систем Семейный сайт будет сформирован из файла главной страницы family.htm и файлов с другими страницами father.htm, mother.htmу son.htmy timka.htmy связанными с главной страницей с помощью гиперссылок. Кроме того, к странице присоединен графический файл photo.gif, в котором хранится семейная фотография. Это внутреннее содержание сайта. Однако с помощью гиперссылок он оказывается связанным с другими сайтами WWW; сайтом Московского государственного университета им. М. В. Ломоносова (МГУ) (место работы папы), сайтом Большого театра (место работы мамы), сайтом лицея (место учебы сына) и сайтом с разнообразной информгщией о собаках. Только наличие таких внешних связей делает ваш сайт элементом Всемирной паутины. Размещение Web-сайта на сервере После того как сайт разработан, т. е. созданы все файлы, его нужно опубликовать в WWW. Опубликовать Web-сайт — значит разместить его на Web-cepeepe. Эта процедура выполняется по согласованию с провайдером Интернет-услуг, от которого пользователь должен получить следующие сведения: • URL-адрес сервера, на котором будет размещен сайт; • имя пользователя и пароль для доступа к серверу (обычно они те же, что и для подключения к Интернету); • имя каталога сервера для размещения вашего сайта. Обычно провайдер инструктирует пользователей о том, как можно осуществить публикацию. Для этих целей можно использовать средства браузера, FTP-клиенты, а также специальные программные средства для публикации Web-страниц. Система основных понятий Web-сайт Структура Web-сайта: множество Web-страниц, связанных гиперссылками. Главная страница — начало просмотра сайта Внутренние гиперсвязи — связи внутри сайта Внешние гиперсвязи — связи с другими сайтами Средства создания Web-страниц Язык HTML, текстовые редакторы Высокоуровневые средства: HTML-редакторы Публикация сайта: размеп^ение сайта на Web-сервере провайдера § 30. Геоинформационные системы 163 Вопросы и задания 1. Что понимается под публикацией Web-сайта? 2. Какие цели может преследовать автор Web-сайта? 3. Что такое HTML? 4. С помощью каких программных средств можно создавать Web-страницы? 5. Какова роль гиперссылок на Web-страницах? 6. Предложите ряд тем для Web-сайтов, которые бы, с вашей точки зрения, могли иметь общественный интерес. Геоинформационные системы Цель этого параграфа — познакомить вас с новейшим классом информационных систем, интенсивно развивающихся в настоящее время. Специалисты предрекают этим системам большое будущее. Зачем нужны геоинформационные системы Огромное количество информации, необходимой в самых разных сферах человеческой деятельности, «привязано» к определенной точке на географической карте. Приведем примеры. Представим себе информационную систему большого города, обеспечивающую информацией городские власти, органы охраны правопорядка, транспортников, энергетиков, связистов, торговлю, медицинские службы, систему образования и пр. Практически каждый раз, запрашивая информацию или вводя новые данные, мы должны ответить на вопрос: где же находится то или иное учреждение, как к нему проехать? Скорая помощь получила вызов — важно прежде всего знать, где ждут помощи. Ищем школу для ребенка — где расположена школа и как туда проехать общественным транспортом. Произошёл прорыв трубы городского коллектора — где и как проехать аварийной службе. Таких примеров множество. Соответствующая информационная система, являющаяся совокупностью баз данных и географических карт (или схем), и представляет собой муниципальную геоинформационную систему (ГИС). В настоящее время муниципальные ГИС используются во многих городах России. На уровне региона или государства в целом информация столь велика по объему и столь многообразна, что целесообразно строить тематические ГИС. Так, в настоящее время в России создается государственный земельный кадастр — информационная система, содержащая реестр сведений о земле, находящейся в хозяйственном обороте (сельскохозяйствен- 164 Глава 5. Технологии использования и разработки информационных систем НОМ, промышленном и т. д.). Очевидно, что без привязки к карте такой кадастр создать невозможно. Другой пример — ГИС «Черное море», созданная несколько лет назад усилиями прилегающих к этому морю стран. Эта ГИС включает огромный объем картографической информации (более 2000 карт) и привязанные к этим картам базы данных по геологии, метеорологии, рыбным запасам, загрязнениям и т. д. Как устроена ГИС Типовая структура ГИС изображена на рис. 5.15. Рис. 5.15. Типовая структура ГИС Современная ГИС является многослойной, т. е. содержит несколько слоев географических карт, связанных друг с другом (например, разных масштабов), к каждому слою может быть подключено несколько таблиц баз данных и наоборот: каждая таблица может быть подключена к нескольким слоям. Для создания ГИС существует большое число отечественных и зарубежных инструментальных программных средств. Наиболее простые из них могут работать на персональных компьютерах, и с их помощью можно создавать практически полезные программы. Следует понимать, что графическая информация, хранимая в ГИС, часто подвергается манипуляциям типа «растянуть», «сжать» и более сложным и поэтому хранится, как правило, в векторном (а не растровом) формате. Если исходная карта вводится в компьютер путем сканирования, то первоначальный растровый формат изображения подвергается специальной обработке, называемой векторизацией, т. е. между линиями и точками, составляющими изображение, устанавливаются геометрические и формульные соотношения. Знакомство с ГИС «Карта Москвы» Создание ГИС не относится к тем задачам, которые можно решить на школьном уроке. Однако знакомство с простейшими готовыми программами этого класса и работа с ними не представляются сложными. § 30. Геоинформационные системы 165 На сайте поисковой системы Рамблер по адресу https://nakarte. rambler. ru размещена ГИС, привязанная к картам многих городов России. Набрав указанный адрес в браузере, вы попадете на главную страницу ГИС. Ее фрагмент показан на рис. 5.16. Карта Москвы П Начало формы Конец формы Конец формы I I I Подробная гшформацнонно-справочная карта стошщы Poccini с детальностью до дома Показаны прнле- j тающие терр1гюрш1. Поиск домов по адресу. ! га фщтиалов РайффайзенБаика ! Карта Санкт-Петербурга ОТКРЫТЬ карт Конецформы I Подробная шгформацнонно-справочная карта северной стошщы Россгаг с детальностью до дома. Показаны пргшегаюицге террнторшг. Поиск домов по адресу. дКарта фншгалов Ра/гффаггзенБанка Рис. 5.16. Фрагмент главной страницы ГИС на Рамблере Выберем карту Москвы и щелкнем на ссылке открыть карту. На экране увидим фрагмент карты Москвы (рис. 5.17). 7-1415 166 Глава 5. Технологии использования и разработки информационных систем Рис. 5.17. Фрагмент карты Москвы в масштабе 1:256000 Изменив масштаб вывода карты (на экране присутствует масштабная шкала), мы увидим укрупненное изображение центргшьной части города. Рис. 5.18. Карта Москвы в укрупненном масштабе 1:4000 С помощью строки ввода Поиск можно искать объекты самых разных типов, размещенные в столице: улицы и дома, учреждения, театры, музеи, учебные заведения, гостиницы, станции метро и многое другое. ГИС поможет вам найти место на карте, подскажет адрес и выдаст много дополнительной полезной информации. § 30. Геоинформационные системы 167 Например, поищем на карте Москвы зоопарк. Наберем в строке Поиск слово «Зоопарк» и отдадим команду Найти. Получим на экране изображение, показанное на рис. 5.19. Rombler ^ Понос / f Mt»ccee^tid!90on»ps Ъ 1 J: ' ' йосим н Моиовсия ^бласл Рис. 5.19. Результат поиска зоопарка Если искомых объектов несколько, то система выдаст их список, в котором дальше нужно будет сделать выбор. Зоопарк в Москве один. Желая получить более подробную информацию о Московском зоопарке, щелкнем на ссылке Подробнее. На экран будет выведено изображение, представленное на рис. 5.20. Дети. Посмотреть на животных s.ixtffKua KWfi ; i Г|!%*П(ит [ U ritiMCKKBwi np>ti , . , ,V) Ajjwc: Б t :<расй01фК№мси1 lIRL: в-лт» 1 T».i«^i: j5;-35-sti. :;5- iJn \r 3mc 10 00-;0.00. Бшяы: аяи ao IS .w ■ Окшап». ■ IW p. Рис. 5.20. Информация о Московском зоопарке 168 Глава 5. Технологии использования и разработки информационных систем На ЭТОЙ странице вы узнаете адрес зоопарка, ближайшую станцию метро, телефоны, адрес Web-сайта, время работы и стоимость билетов. Достаточно подробные данные! Здесь же можно узнать о мероприятиях, проводимых в зоопарке, например о проходяпдей в зоопарке выставке топиарного искусства (рис. 5.21). Выставка топиарного нск>'сства Рейтанг:>Г>4Г4' Фигуры жгшотных из веток кохии, ячменя, акации. Шестиыет|50вый Кинг-Конг, четырехметровая Панда, Внннн-Щ'х, Орел и Котенок. Time iDiit Москва Начало формь! I 11936969 Ваша оценка: lif' jlif' f4jf' (5i^ ! Проголосовать! “ ! I • Г j I ' ! ' i Конец фрр.мь1 Оценка; 4.86, всего проголосовало; 7 Рис. 5.21. Страница с информацией о выставке в Московском зоопарке Использование ГИС часто бывает весьма полезно для работы, в бытовых ситуациях. Неоценимо значение ГИС с познавательной точки зрения. Вместо статичных карт, с которыми вы обычно имеете дело на уроках географии, вам предоставляются «живые» карты-собеседники, способные ответить на любые вопросы, касаюпциеся ориентирования на какой-либо местности. § 31. База данных — основа информационной системы 169 Система основных понятий ГИС — геоинформационные системы Информационные системы, базирующиеся на картах территорий Области приложений ГИС Управление и развитие территорий Территориальные службы жизнеобеспечения Справки для населения: метеосправка, адресная справка, поиск объектов и пр. Многое другое Устройство ГИС Система баз данных Система обслуживания запросов Блок картографической информации Дружеский пользовательский интерфейс Вопросы и задания 1. а) Назовите возможные области практического применения ГИС. б) В чем заключается многослойный принцип структуры ГИС? в) Какая информация включается в ГИС? г) Что такое векторизация? В чем смысл использования этой процедуры в ГИС? 2. Какие основные режимы работы возможны с ГИС типа «Карта города*? 3. Попробуйте описать основные точки навигации для поиска своего города на электронной карте России. База данных — основа информационной системы Что такое база данных Основой для многих информационных систем (прежде всего, информационно-справочных систем) являются базы данных. База данных (БД) — это совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отражающих состояние и взаимодействие объектов в определенной предметной области. 170 Глава 5. Технологии использования и разработки информационных систем Под вычислительной системой здесь понимается отдельный компьютер или компьютерная сеть. В первом случае база данных называется централизованной, во втором случае — распределенной. База данных является компьютерной информационной моделью некоторой реальной системы. Например, книжного фонда библиотеки, кадрового состава предприятия, учебного процесса в школе и т. д. Такую систему называют предметной областью базы данных и информационной системы, в которую БД входит. Описание структуры данных, хранимых в БД, называется моделью представления данных или короче — моделью данных. В теории БД известны три классические модели данных: иерархическая, сетевая и реляционная (табличная). Об этом уже шла речь в § 14. По виду используемой модели данных базы данных делятся на иерархические, сетевые и реляционные (табличные). В последние годы при разработке информационных систем стали использоваться и другие виды моделей данных. К ним относятся объектно-ориентированные, объектно-реляционные, многомерные и другие модели. Классическим вариантом, и пока наиболее распространенным, остается реляционная модель. В базовом курсе информатики вы уже знакомились с основами реляционных БД. Вспомним главные понятия, связанные с ними. Реляционная модель данных Основной информационной единицей реляционной БД является таблица. База данных может состоять из одной таблицы (однотабличная БД) или из множества взаимосвязанных таблиц (многотабличная БД). Структурными составляюпцими таблицы являются записи и поля. поле 1 поле 2 поле 3 запись 1 запись 2 запись 3 . . . Каждая запись содержит информацию об отдельном объекте системы: одной книге в библиотеке, одном сотруднике предприятия и т. п. А каждое поле — это определенная характеристика (свойство, атрибут) объекта: название книги, автор книги, фамилия сотрудника, год рождения и т. п. Поля таблицы должны иметь несовпадаюпцие имена. В одной таблице не должно быть повторяющихся записей. Для каждой таблицы реляционной БД определяется главный ключ — поле или совокупность полей, однозначно определяюш;их запись. Иначе говоря, значение главного ключа не должно повторяться в разных записях. Например, в библиотечной базе данных в качестве такого ключа может быть выбран инвентарный номер книги, который не может совпадать у разных книг. § 31. База данных — основа информационной системы 171 Для строчного представления структуры таблицы применяется следующая форма: ИМЯ_ТАБЛИЦЫ (ИМЯ_ПОЛЯ 1, ИМЯ_ПОЛЯ_2, ИМЯ_ПОЛЯ_К) Подчеркиваются поля, составляющие главный ключ. В теории реляционных баз данных таблица называется отношением. Отношение по-английски — relation. Отсюда происходит название «реляционные базы данных». ИМЯ ТАБЛИЦЫ в нашем примере — это имя отношения. Примеры отношений: БИБЛИОТЕКА (ИНВ_НОМЕР, АВТОР, НАЗВАНИЕ, ГОД_ИЗД, ИЗДАТЕЛЬСТВО). БОЛЬНИЦА (ПАЛАТА, НОМЕР_МЕСТА, ПАЦИЕНТ, ДАТА_ПОСТУПЛЕНИЯ, ДИАГНОЗ, ПЕРВИЧНЫЙ) Каждое поле таблицы имеет определенный тип. С типом связаны два свойства поля: 1) множество значений, которые оно может принимать; 2) множество операций, которые над ним можно выполнять. Поле имеет также формат (длину). Существуют четыре основных типа для полей БД: символьный, числовой, логический и дата. Для полей таблиц БИБЛИОТЕКА и БОЛЬНИЦА могут быть установлены следующие типы: символьный тип: АВТОР, НАЗВАНИЕ, ИЗДАТЕЛЬСТВО, ПАЦИЕНТ, ДИАГНОЗ; числовой тип: ИНВ_НОМЕР, ГОД_ИЗД, ПАЛАТА, НОМЕР_МЕСТА дата: ДАТА_ПОСТУП; логический: ПЕРВИЧНЫЙ. В нашем случае поле ПЕРВИЧНЫЙ показывает, поступил больной в больницу с данным диагнозом впервые или повторно. Те записи, где значение этого поля равно TRUE (ИСТИНА), относятся к первичным больным, значение FALSE (ЛОЖЬ) отмечает повторных больных. Таким образом, поле логического типа может принимать только два значения. В таблице БОЛЬНИЦА используется составной ключ — состоящий из двух полей: ПАЛАТА И НОМЕР МЕСТА. Только их сочетание не повторяется в разных записях (ведь фамилии пациентов могут совпадать). Система управления базами данных (СУБД) Система управления базами данных (СУБД) — комплекс языковых и программных средств, предназначенных для создания, ведения и использования базы данных многими пользователями. В зависимости от вида используемой модели данных различаются иерархические, сетевые и реляционные СУБД. 172 Глава 5. Технологии использования и разработки информационных систем Наибольшее распространение на персональных компьютерах получили так называемые полнофункциональные реляционные СУБД. Они выполняют одновременно как функцию системных средств (см. рис. 5.1), так и функцию пользовательского инструмента для создания приложений. Примером СУБД такого типа является Microsoft Access. Полноценная информационная система на компьютере состоит из трех частей: СУБД -Ь база данных -Ь приложения. Основные действия, которые пользователь может выполнять с помощью СУБД: • создание структуры базы данных; • заполнение базы данных информацией; • изменение (редактирование) структуры и содержания базы данных; • поиск информации в БД; • сортировка данных. Система основных понятий База данных Назначение БД: организованное хранение данных в информационной системе Предметная область — область реальной действительности, отражаемая (моделируемая) в БД Модель данных — описание структуры данных, хранимых в БД Виды моделей данных Иерархическая Сетевая Реляцион- ная Другие: объектно-ориентированная, объектно-реляционная и пр. Структура реляционной модели Таблица — основная структурная составляющая реляционной БД Запись — строка таблицы; в таблице нет повторяющихся строк Поле — элемент записи (столбец таблицы) Имя таблицы (имя отношения) Главный ключ — идентификатор записи (простой,составной) Атрибуты поля: имя, тип, формат Система управления базами данных (СУБД) — программное обеспечение для работы с базой данных § 32. Проектирование многотабличной базы данных 173 Вопросы и задания 1. а) Для чего предназначены базы данных? Выберите верный ответ: 1) для выполнения вычислений на компьютере; 2) для осуществления хранения, поиска и сортировки данных; 3) для принятия управляющих решений. б) Какие существуют варианты классификации БД? в) Почему реляционный вид БД является наиболее распространенным? г) Что такое запись в реляционной БД? д) Что такое поле, тип поля; какие бывают типы полей? е) Что такое главный ключ записи? 2. Определите главный ключ и типы записей в следующих отношениях: АВТОБУСЫ (НОМЕР МАРШРУТА, НАЧАЛЬНАЯ ОСТАНОВКА, КОНЕЧНАЯ ОСТАНОВКА) КИНО (КИНОТЕАТР, СЕАНС, ФИЛЬМ, РОССИЙСКИЙ, ДЛИТЕЛЬНОСТЬ) УРОКИ (ДЕНЬ НЕДЕЛИ, НОМЕР УРОКА, КЛАСС, ПРЕДМЕТ, ПРЕПОДАВАТЕЛЬ) 3. Опишите структуру записей (имена полей, типы полей, главные ключи) для баз данных: РЕЙСЫ САМОЛЕТОВ, ШКОЛЫ ГОРОДА, СТРАНЫ МИРА. Проектирование многотабличной базы данных Рассмотрим на конкретном примере методику проектирования многотабличной базы данных. Для этого снова вернемся к задаче моделирования работы с информацией, выполняемой приемной комиссией при поступлении абитуриентов в университет (см. § 15). Табличная форма модели данных В § 15 была построена модель данных, состоящая из трех взаимосвязанных таблиц. Воспроизведем ее еще раз. ФАКУЛЬТЕТЫ СПЕЦИАЛЬНОСТИ Название факультета Название специальности Экзамен 1 Название факультета Экзамен 2 План приема Экзамен 3 174 Глава 5. Технологии использования и разработки информационных систем АБИТУРИЕНТЫ Регистрационный номер Фамилия Имя Отчество Дата рождения Город Законченное учебное заведение Название специальности Производственный стаж Медаль Оценка за экзамен 1 Оценка за экзамен 2 Оценка за экзамен 3 Зачисление Эти три таблицы можно рассматривать как модель данных в реляционной СУБД. Но работать с БД в таком виде неудобно. Помимо того, что реляционная БД должна состоять из таблиц, к ней предъявляется еще ряд требований. Одним из главных требований является требование отсутствия избыточности (или минимизация избыточности) данных. Избыточность приводит к лишнему расходу памяти. Память нужно экономить. Это не только увеличивает информационную плотность базы данных, но и сокращает время поиска и обработки данных. Очевидный недостаток описанных таблиц — многократное повторение длинных значений полей в разных записях. Например, название специальности «Радиофизика и электроника» будет повторяться в 100 записях для 100 абитуриентов, которые на нее поступают. Проще сделать так. В таблице СПЕЦИАЛЬНОСТИ для каждой специальности ввести свой короткий код. Тогда полное название запишется в БД только один раз, а в анкетах абитуриентов будет указываться только код. Точно так же можно закодировать названия факультетов. Внесем изменения в таблицы ФАКУЛЬТЕТЫ и СПЕЦИАЛЬНОСТИ. § 32. Проектирование многотабличной базы данных 175 Здесь предполагаются два упрощающих допущения: пусть на разных специальностях одного факультета сдаются одни и те же экзамены, а число экзаменов на всех факультетах равно трем (это вполне разумно). Очень неудобной для работы является таблица АБИТУРИЕНТЫ. В ней слишком много полей. В частности, такую таблицу неудобно будет просматривать на экране, легко запутаться в полях. Поступим следующим образом. Разделим «большую» таблицу АБИТУРИЕНТЫ на четыре таблицы поменьше: АНКЕТЫ АБИТУРИЕНТЫ ОЦЕНКИ ИТОГИ Регистрационный номер Регистрационный номер Регистрационный номер Регистрационный номер Фамилия Код специальности Оценка за экзамен 1 Зачисление Имя Медаль Оценка за экзамен 2 Отчество Производственный стаж Оценка за экзамен 3 Дата рождения Город Законченное учебное заведение С такими таблицами работать гораздо проще. На разных этапах работы приемной комиссии каждая из этих таблиц будет иметь самостоятельное значение. Таблица АНКЕТЫ содержит анкетные данные, не влияющие на зачисление абитуриента в вуз. В таблице АБИТУРИЕНТЫ содержатся сведения, определяющие, куда поступает абитуриент, а также данные, которые могут повлиять на его зачисление (стаж и наличие медали). Таблица ОЦЕНКИ — это ведомость, которая будет заполняться для всех абитуриентов в процессе приема экзаменов. Таблица ИТОГИ будет содержать результаты зачисления всех абитуриентов. Отношения и связи Каждая из спроектированных выше таблиц будет представлена в БД отдельным отношением. Опишем все их в строчной форме, дав в некоторых случаях полям сокращенные имена и подчеркнув главные ключи. ФАКУЛЬТЕТЫ (КОД_ФКТ, ФАКУЛЬТЕТ, ЭКЗАМЕН_1, ЭКАМЕН_2, ЭКЗАМЕН_3) СПЕЦИАЛЬНОСТИ (КОД_СПЕЦ, СПЕЦИАЛЬНОСТЬ, КОД_ФКТ, ПЛАН) АБИТУРИЕНТЫ (РЕГ_НОМ, КОД_СПЕЦ, МЕДАЛЬ, СТАЖ) АНКЕТЫ (РЕГ_НОМ, ФАМИЛИЯ, ИМЯ, ОТЧЕСТВО, ГОД_РОЖД, ГОРОД, УЧ_ЗАВЕДЕНИЕ) 176 Глава 5. Технологии использования и разработки информационных систем ОЦЕНКИ (РЕГ_НОМ, ОЦЕНКА_1, ОЦЕНКА_2, ОЦЕНКА_3) ИТОГИ (РЕГ_НОМ, ЗАЧИСЛЕНИЕ) Чтобы эти шесть таблиц представляли собой систему, между ними должны быть установлены связи. Фактически связи уже имеются через общие имена полей. Первые два отношения связаны между собой кодом факультета, второе и третье — кодом специальности, а четыре последних — регистрационным номером. Связи позволяют определить соответствия между любыми данными в этих таблицах, например между фамилией некоторого абитуриента и его оценкой по математике; между названием города и результатами экзамена по русскому языку выпускников школ этого города и пр. Благодаря этим связям становится возможным получение ответов на запросы, требующие поиска информации в нескольких таблицах одновременно. Схема базы данных Для явного указания связей между таблицами должна быть построена схема базы данных. В схеме указывается наличие связей между таблицами и типы связей. Схема для нашей системы представлена на рис. 5.22. Рис. 5.22. Схема базы данных В схеме использованы два типа связей: один к одному и один ко многим. Первый обозначен двунаправленной одинарной стрелкой, второй — одинарной стрелкой в одну сторону и двойной — в другую. При связи «один к одному» с одной записью в таблице связана одна запись в другой таблице. Например, одна запись об абитуриенте связана с одним списком оценок. При нгшичии связи «один ко многим» одна запись в некоторой таблице связана с множеством записей в другой таблице. Например, с одним факультетом связано множество специальностей, а с одной специгшьностью — множество абитуриентов, поступающих на эту специальность. § 32. Проектирование многотабличной базы данных 177 Как говорилось ранее, связь «один ко многим» — это связь между двумя соседними уровнями иерархической структуры. А таблицы, связанные отношениями « один к одному», находятся на одном уровне иерархии. В принципе все они могут быть объединены в одну таблицу, поскольку главный ключ у них один — РЕГ_НОМ. Но чем это неудобно, было объяснено выше. Что такое целостность данных СУБД поддерживает организацию связей между таблицами БД, обеспечивающую одно важное свойство базы данных, которое называется целостностью данных. Система не допустит, чтобы одноименные поля в разных связанных между собой таблицах имели разные значения. Согласно этому принципу, будет автоматически контролироваться ввод данных. В связанных таблицах может быть установлен режим каскадной замены: если в одной из таблиц изменяется значение поля, по которому установлена связь, то в других таблицах одноименные поля автоматически изменят свои значения. Аналогично действует режим каскадного удаления: достаточно удалить запись из одной таблицы, чтобы связанные записи исчезли из всех остальных таблиц. Это естественно, поскольку, например, если закрывается какой-то факультет, то исчезают и все его специальности. Или если у абитуриента изменяют регистрационный номер в таблице АБИТУРИЕНТЫ, то автоматически номер должен обновиться и в других таблицах. На этом проектирование базы данных завершается. Это был теоретический этап. Практическая работа по созданию базы данных будет проходить в рамках компьютерного практикума. Система основных понятий Проектирование многотабличной базы данных 1-й этап: анализ предметной области Результат: построение структуры данных — информационной модели предметной области 2-й этап: построение модели данных для будущей БД Реляционная модель данных (система таблиц) Типы связей Схема Целостность Один к одному, Граф, отражающий Свойство согласованности действий с повто- один ко многим структуру данных и связей в БД ряющимися данными (поддерживается СУБД) 178 Глава 5. Технологии использования и разработки информационных систем Вопросы и задания 1. а) Перечислите задачи, которые должна решать проектируемая информационная система «Приемная комиссия*. б) Какие информационные процессы происходят на различных этапах приемной кампании в вузе? в) Какая информация добавляется к базе данных на каждом этапе? 2. а) В чем заключается построение модели данных? б) Что означает свойство целостности БД? в) Какие данные следует добавить в БД приемной комиссии, если требуется учитывать преподавателей, принимаюш;их экзамены, и деление абитуриентов на экзаменационные группы? г) Какие данные следует добавить в БД приемной комиссии, если дополнительно к требованиям предыдущего задания нужно учитывать расписание экзаменов, т. е. сведения о том, где, когда и какому преподавателю сдает экзамен данная группа? д) Постройте схему БД с учетом выполнения заданий 2, в и 2, г. 3. а) При проектировании БД были определены следующие отношения: МАГАЗИН(НОМЕР_МАГ, ТИП, АДРЕС, ДИРЕКТОР, ТЕЛЕФОН) ОТДЕЛ (НАЗВАНИЕ_ОТД, ЗАВЕДУЮЩИЙ, ТЕЛЕФОН) ПРОДАВЕЦ (ТАБЕЛЬНЫЙ_НОМ, ФАМИЛИЯ, ИМЯ, ОТЧЕСТВО, КАТЕГОРИЯ) Являются ли эти отношения связанными? Добавьте все, что необходимо для их связи; изобразите схему БД в графическом виде. б) Спроектируйте базу данных для информгщионной системы «Наша школа*, содержащей сведения об учителях, учениках, классах, изучаемых предметах. Замечание’, данное задгшие носит творческий характер и может быть выполнено во многих вариантах. Устройте конкурс на лучшее решение этой задачи. Создание базы данных База данных создается средствами СУБД. Создание происходит в два этапа: 1) Построение структуры таблиц и установка связей. 2) Ввод данных в таблицы. На первом этапе в каждой таблице определяются имена полей, их типы и форматы. Совсем не обязательно все таблицы БД должны быть построены одновременно. В нашем примере на начальном этапе работы приемной комиссии могут быть созданы таблицы ФАКУЛЬТЕТЫ и СПЕЦИАЛЬНОСТИ. Структуры этих таблиц представлены в табл. 5.1 и 5.2. § 33. Создание базы данных Таблица 5.1. ФАКУЛЬТЕТЫ 179 Имя поля Тип поля Длина (Формат) КОД_ФКТ текстовый 2 ФАКУЛЬТЕТ текстовый 30 ЭКЗАМЕН_1 текстовый 30 ЭКЗАМЕН_2 текстовый 30 ЭКЗАМЕН_3 текстовый 30 Таблица 5.2. СПЕЦИАЛЬНОСТИ Имя поля Тип поля Длина (Формат) КОД_СПЕЦ текстовый 3 СПЕЦИАЛЬНОСТЬ текстовый 30 КОД_ФКТ текстовый 2 ПЛАН числовой Целое Затем средствами СУБД устанавливаются связи между таблицами через общее поле КОД_СПЕЦ. После этого таблицы можно заполнять данными. Современные СУБД предоставляют пользователю удобные средства ввода. Данные можно вводить непосредственно в строки таблиц, отражаемых на экране, или через дигшоговые окна — формы (рис. 5.23). В процессе ввода данных СУБД осуществляет автоматический контроль соответствия вводимых данных объявленным типам и форматам полей. Й- Анкет Я[=1ЕЗ РЕГ.НОМ [1012“ ФАМИЛИЯ |Вйсильева ИМЯ 1 Ольга ОТЧЕСТВО |Николаевна ГОРОД j Пермь ДАТА_Р0ЖД j 12,1081 ЫЧ.ЗАВЕДЕНИЕ |пту N=aj зтеь'. Т ИиГНиэ 12 Рис. 5.23. Форма для ввода, просмотра и редактирования таблицы В табл. 5.3 приведены первые три записи таблицы ФАКУЛЬТЕТЫ, а в табл. 5.4 — niecTb записей таблицы СПЕЦИАЛЬНОСТИ. 180 Глава 5. Технологии использования и разработки информационных систем Таблица 5.3. ФАКУЛЬТЕТЫ КОД_ФКТ ФАКУЛЬТЕТ ЭКЗАМЕН_1 ЭКЗАМЕН_2 ЭКЗАМЕН_3 01 экономический математика география русский язык 02 исторический история Отечества иностранный язык сочинение 03 юридический русский язык иностранный язык обществознание Таблица 5.4. СПЕЦИАЛЬНОСТИ КОД_СПЕЦ СПЕЦИАЛЬНОСТЬ КОД_ФКТ ПЛАН 101 финансы и кредит 01 25 102 бухгалтерский учет 01 40 201 история 02 50 203 политология 02 25 310 юриспруденция 03 60 311 социальная работа 03 25 На этапе приема документов в базу данных будут добавлены таблицы АНКЕТЫ и АБИТУРИЕНТЫ. Их структуры представлены в табл. 5.5 и 5.6. Таблица 5.5. АНКЕТЫ — структура таблицы Имя поля Тип поля Длина (формат) РЕГ_НОМ текстовый 4 ФАМИЛИЯ текстовый 30 ИМЯ текстовый 20 ОТЧЕСТВО текстовый 20 ДАТА_РОЖД дата ГОРОД текстовый 30 УЧ_ЗАВЕДЕНИЕ текстовый 50 Таблица 5.6. АБИТУРИЕНТЫ — структура таблицы Имя поля Тип поля Длина (формат) РЕГ_НОМ текстовый 4 КОД_СПЕЦ текстовый 3 МЕДАЛЬ логический СТАЖ числовой плавающий, 1 цифра после запятой § 33. Создание базы данных 181 После установки связей таблицы будут заполняться данными. Первые двенадцать записей в этих таблицах приведены в табл. 5.7, табл. 5.8. Таблица 5,7. АНКЕТЫ РЕГ_НОМ ФАМИЛИЯ ИМЯ ОТЧЕСТВО ГОРОД ДАТА, РОЖД УЧ ЗАВЕДЕНИЕ 1012 Васильева Ольга Николаевна Пермь 12.10.81 ПТУ № 8 1023 Быков Алексей Ильич Кунгур 24.04.82 Школа № 7 1119 Круг Борис Моисеевич Пермь 18.09.82 Школа № 102 1120 Листьев Дмитрий Владимиро- вич Березники 01.12.81 Школа № 5 2010 Елькин Виктор Алексеевич Лысьва 20.07.82 ПТУ № 1 2015 Мухин Олег Иванович Пермь 25.03.78 Школа № 77 2054 Григорьева Наталья Дмитриевна Березники 14.02.80 Школа № 3 2132 Зубова Ирина Афанасьевна Пермь 22.11.81 Школа № 96 3005 Анохин Сергей Петрович Пермь 30.03.82 Школа № 12 3034 Жакин Николай Якимович Пермь 19.10.81 Школа № 12 3067 Дикий Илья Борисович Березники 28.12.77 Школа № 3 3118 Ильин Петр Викторович Кунгур 14.07.80 ПТУ № 8 Таблица 5.8. АБИТУРИЕНТЫ РЕГ_НОМ КОД_СПЕЦ МЕДАЛЬ СТАЖ 1012 101 т 1 1023 101 □ 0 1119 102 0 0 1120 102 0 0 2010 201 □ 0 2015 203 □ 3 2054 203 0 2 2132 201 □ 0 3005 310 □ 0 3034 311 □ 1 3067 310 □ 3 3118 310 □ 2 - 182 Глава 5. Технологии использования и разработки информационных систем Когда начнутся приемные экзамены, понадобится таблица ОЦЕНКИ, Опишем ее структуру —табл. 5.9. Таблица 5.9. ОЦЕНКИ — структура таблицы Имя поля Тип поля Длина (формат) РЕГ_НОМ текстовый 4 ОЦЕНКА_1 числовой байтовый ОЦЕНКА_2 числовой байтовый ОЦЕНКА_3 числовой байтовый Тип «байтовый» является разновидностью типа «целый». Он применяется для целых положительных чисел в диапазоне от О до 255 и занимает в памяти 1 байт. Поскольку оценки принимают значения от 2 до 5, то этот тип оказывается наиболее «экономным». А вот какой вид примет таблица с результатами сдачи экзаменов перечисленными выше двенадцатью абитуриентами — табл. 5.10. Таблица 5.10. ОЦЕНКИ РЕГ_НОМ ОЦЕНКА_1 ОЦЕНКА_2 ОЦЕНКА_3 1012 4 5 5 1023 4 4 4 1119 5 5 5 1120 3 5 5 2010 3 2 0 2015 5 5 5 2054 4 5 5 2132 4 3 5 3005 3 0 0 3034 3 3 4 3067 5 4 3 3118 5 5 4 И наконец, осталось создать таблицу ИТОГИ для занесения в нее результатов зачисления абитуриентов в университет. Структура ее описана в табл. 5.11. Таблица 5.11. ИТОГИ — структура таблицы Имя поля Тип поля Длина (Формат) РЕГ_НОМ текстовый 4 ЗАЧИСЛЕНИЕ логический Содержание таблицы приведено в табл. 5.12. § 33. Создание базы данных 183 Таблица 5.12. ИТОГИ РЕГ_НОМ ЗАЧИСЛЕНИЕ 1012 □ 1023 □ 1119 □ 1120 □ 2010 □ 2015 □ 2054 □ 2132 □ 3005 □ 3034 □ 3067 □ 3118 □ Логические значения поля ЗАЧИСЛЕНИЕ первоначально отмечаются пустыми квадратиками, обозначающими «ложь» («нет») (значение по умолчанию логического поля — «нет»). После объявления итогов для принятых абитуриентов это значение будет заменено на «да» (выставлена галочка). Осталось подключить эту таблицу к схеме через поле РЕГ_НОМ. Система основных понятий Создание базы данных Создание БД осуществляется средствами СУБД Создание структуры БД Ввод данных Создание таблиц Установка связей (создание схемы) Ввод в строки Ввод через форму таблицы Описание полей, типов, форматов, ключей Связи через общие поля: один к одному или один ко многим Автоматический контроль соответствия данных типам и форматам полей Вопросы и задания 1. Что нужно иметь для того, чтобы начать процесс создания базы данных? 2. Какую информацию нужно указать СУБД для создания таблиц БД? 3. Каким способом можно вводить данные в таблицы? 4. В чем СУБД помогает пользователю производить безошибочный ввод данных? 184 Глава 5. Технологии использования и разработки информационных систем Запросы как приложения информационной системы Действия, выполняемые над информацией, хранящейся в базе данных, называются манипулированием данными. К ним относятся выборка данных по некоторым условиям, сортировка данных, обновление, удаление устаревших и добавление новых данных. Выполнение этих действий производится с помощью запросов. Запрос — это команда к СУБД на выполнение определенного вида манипулирования данными. Существует универсальный язык, на котором формулируются запросы во многих СУБД. Он называется SQL (Structured Query Language) — структурированный язык запросов. Здесь мы оказываемся перед выбором, с которым часто приходится сталкиваться в информатике: обучаться составлению запросов на языке SQL или воспользоваться каким-то более высокоуровневым вспомогательным средством. В большинстве современных СУБД такие средства имеются. Например, в Microsoft Access это конструктор запросов. В учебных целях мы будем использовать строчное описание команд запросов на придуманном (гипотетическом) языке. Он близок к SQL, однако имеет не такой строгий синтаксис и, кроме того, использует русские служебные слова. Команда запроса на выборку данных из БД на гипотетическом языке запросов имеет следующий формат: .выбрать <список выводимых полей> где <условие выбора> сортировать <ключ сортировки> по <порядок сортировки> Не все составляющие этой команды являются обязательными. Могут отсутствовать условие выбора и порядок сортировки. Кроме того, ключей сортировки может быть несколько. Тогда они записываются в порядке приоритетов: первый, второй и т. д. Опишем серию запросов на гипотетическом языке, которую позже в практикуме реализуем средствами СУБД. В базовом курсе информатики вы учились составлять запросы к однотабличной БД. Теперь рассмотрим примеры запросов, для выполнения которых потребуется извлекать данные из нескольких таблиц. Запрос 1. Требуется получить список всех специальностей университета с указанием факультета и плана приема на специальность. Список отсортировать в алфавитном порядке по двум ключам: названию факультета (первый ключ) и названию специгьльности (второй ключ). В этом запросе не будет использовано условие выбора, поскольку в итоговый список войдет информация из всех записей таблиц ФАКУЛЬТЕТЫ § 34. Запросы как приложения информационной системы 185 И СПЕЦИАЛЬНОСТИ. В разделе сортировки должно быть указано два ключа по порядку. Напомним, что в таком случае сортировка сначала происходит по первому ключу и, в случае совпадения у нескольких записей его значения, они упорядочиваются по второму ключу. Если в запросе используются поля из разных таблиц, то для их обозначения применяются составные имена, включающие разделенные точкой имя таблицы и имя поля в этой таблице. Команда для данного запроса будет следующей: .выбрать ФАКУЛЬТЕТЫ.ФАКУЛЬТЕТ, СПЕЦИАЛЬНОСТИ. СПЕЦИАЛЬНОСТЬ, СПЕЦИАЛЬНОСТИ.ПЛАН сортировать ФАКУЛЬТЕТЫ. ФАКУЛЬТЕТ по возрастанию, СПЕЦИАЛЬНОСТИ. СПЕЦИАЛЬНОСТЬ по возрастанию Результат выполнения запроса — таблица 5.13. Таблица 5.13. План приема: запрос на выборку ФАКУЛЬТЕТЫ СПЕЦИАЛЬНОСТИ ПЛАН исторический история 50 исторический политология 25 экономический бухгалтерский учет 40 экономический финансы и кредит 25 юридический социальная работа 25 Запрос 2. Получить список всех абитуриентов, поступающих на юридический факультет, имеющих производственный стаж. Указать фамилию, город, специальность и стаж. Упорядочить по фамилиям. В этом запросе должны использоваться четыре таблицы одновременно: АНКЕТЫ, СПЕЦИАЛЬНОСТИ, АБИТУРИЕНТЫ, ФАКУЛЬТЕТЫ. Условие выбора в этом запросе будет представлять собой логическое выражение, содержащее операцию логического умножения «И» — конъюнкцию. Подробнее способы записи логических выражений мы обсудим в следующем параграфе. На гипотетическом языке запросов команда будет выглядеть так: .выбрать АНКЕТЫ.ФАМИЛИЯ, АНКЕТЫ.ГОРОД, СПЕЦИАЛЬНОСТИ.СПЕЦИАЛЬНОСТЬ, АБИТУРИЕНТЫ.СТАЖ где ФАКУЛЬТЕТЫ.ФАКУЛЬТЕТ= "Юридический” и АБИТУРИЕНТЫ.СТАЖ>0 сортировать АНКЕТЫ.ФАМИЛИЯ по возрастанию В результате будет получена таблица 5.14. 8-1415 186 Глава 5. Технологии использования и разработки информационных систем Таблица 5.14. Юристы со стажем: запрос на выборку ФАМИЛИЯ ГОРОД СПЕЦИАЛЬНОСТЬ СТАЖ Дикий Березники юриспруд енци я Жакин Пермь социальная работа Ильин Кунгур юриспруденция В компьютерном практикуме вы научитесь реализовывать такие запросы в среде СУБД Microsoft Access. Кроме того, вы будете строить запросы на удаление записей, научитесь организовывать вычисляемые поля в запросах, создавать формы для ввода и просмотра таблиц, формировать отчетные печатные документы. Система основных понятий Запросы — приложения ИС Запрос — команда к СУБД на выполнение определенного вида манипулирования данными Средства формирования запросов SQL {Structured Query Language) — структурированный язык запросов. Конструктор запросов (Microsoft Access) Структура запроса на выборку Список полей Условие выбора записей Ключи и порядок сортировки Имена полей (простые или составные), выводимые по запросу Логическое выражение, которому удовлетворяют выбираемые записи Один ключ или последовательность ранжированных ключей. Порядок: по возрастанию, по убыванию Вопросы и задания 1. а) Что входит в понятие манипулирования данными в БД? б) Какова цель запроса на выборку? 2. Напишите на гипотетическом языке запросов команду, формирующую таблицу расшифровки кодов специальностей. Строки должны быть упорядочены по возрастанию кодов. 3. Придумайте серию запросов к базе дгшных, построенной по индивидуальному заданию в практикуме. Представьте эти запросы на гипотетическом языке. § 35. Логические условия выбора данных 187 Логические условия выбора данных При построении запросов на выборку важное значение имеет правильная запись условий выбора. Условие выбора — это логическое выражение, которое должно быть истинным для выбираемых записей БД. Логические выражения представляются на языке математической логики, с элементами которой вы знакомились в базовом курсе. Вспомним основные понятия логики, знание которых нам понадобится в дальнейшем. 1. Логическая величина — это величина, принимающая одно из двух значений — ИСТИНА (TRUE) и ЛОЖЬ (FALSE). В базах данных поле логического типа — это логическая величина. 2. Логическое выражение — это утверждение, которое может быть либо истинным, либо ложным. Логическое выражение состоит из логических констант, логических переменных, операций отношения и логических операций. 3. Операции отношения сравнивают значения двух величин. Знаки операций отношения: = (равно), о (не равно), > (больше), < (меньше), >= (больше или равно), <= (меньше или равно). Сравнение числовых величин производится в их арифметическом смысле; сравнение символьных величин — с учетом порядка символов в таблице кодировки; величины типа «дата» и «время» сравниваются по их последовательности во времени. 4. Существуют три основные логические операции: отрицание — НЕ (NOT), конъюнкция — И (AND), дизъюнкция — ИЛИ (OR). Их правила выполнения отражаются в таблице истинности. А В НЕ А А ИВ А или в ИСТИНА ИСТИНА ЛОЖЬ ИСТИНА ИСТИНА ИСТИНА ЛОЖЬ ЛОЖЬ ЛОЖЬ ИСТИНА ЛОЖЬ ИСТИНА ИСТИНА ЛОЖЬ ИСТИНА ЛОЖЬ ЛОЖЬ ИСТИНА ЛОЖЬ ЛОЖЬ 5. По убыванию старшинства логические операции расположены в следующем порядке: НЕ, И, ИЛИ. Для влияния на последовательность выполнения операций в логических выражениях могут употребляться круглые скобки. Сначала потренируемся на формальном примере в составлении логических выражений — условий выбора записей из БД. Рассмотрим следующую таблицу: 188 Глава 5. Технологии использования и разработки информационных систем Ключи записей Поля А В С т 1 2 3 R2 1 3 1 R3 2 2 2 R4 3 3 3 R5 3 2 3 Это однотабличная БД, в которой А, Б, С являются числовыми полями, а Б1, R2 и т. д. — идентификаторами (ключами) записей. Ниже приведены примеры условий выбора, содержащих логические операции, и результаты выбора, т. е. записи, удовлетворяющие этим условиям. Внимательно изучите эти примеры и постарайтесь понять их. Условие: 1) А=1 ИБ=2 2) А=1 ИЛИА=3 3) А=1 ИЛИ Б=2 4) А=1 ИЛИ Б=2 ИЛИ С=3 5) А-1ИБ=2ИС=3 6) НЕА=1 Ответ: R1 Б1,Б2,Б4,Б5 Б1,Б2,БЗ,Б5 Б1,Б2, БЗ,Б4, Б5 Б1 БЗ, Б4, Б5 Из этих примеров важно усвоить правила выполнения операций конъюнкции (И) и дизъюнкции (ИЛИ). Каждая из этих операций объединяет два условия (отношения). В результате выполнения операции ИЛИ в одну выборку объединяются записи, удовлетворяющие каждому из условий. Операция И работает иначе: сначала выбираются все записи, удовлетворяющие первому условию, затем из отобранных записей выбираются те, которые удовлетворяют второму условию. В каждом из следующих выражений присутствуют разные логические операции, поэтому при их выполнении нужно учитывать старшинство операций. Ответ: :Б1,Б4,Б5 :Б1,Б2,Б5 :Б1,БЗ,Б4, Б5 :Б1,Б5 И наконец, приведем примеры, в которых значения одних полей сравниваются со значениями других полей, а также с арифметическими выражениями. Условие: Ответ: Условие: 7) А=1 И Б=2 ИЛИ С=3 8) А=1 ИЛИ Б=2 И С=3 9) НЕ А=1 ИЛИ Б=2 И С=3 10) (А=1 ИЛИ Б=2) И С=3 11) Б>=А 12) Б>=А И Б>=С 13) А=Б ИЛИА=С 14) С=А + Б Б1, Б2, БЗ, Б4 Б2, БЗ, Б4 Б2,БЗ, Б4,Б5 Б1 § 35. Логические условия выбора данных 189 В компьютерном практикуме вы уже познакомились с табличной формой представления условий запроса в конструкторе запросов. Можно говорить о том, что в конструкторе запросов используется табличный способ представления логических выражений. Разберемся подробнее с этим способом, В ячейках таблицы конструктора запросов записываются условия, накладываемые на значения соответствующих полей. Условия, стоящие в одной строке, выполняются одновременно, т. е. они соединяются между собой операцией И; условия в разных строках соединяются операцией ИЛИ. Таблица играет роль фильтра при выборе записей из БД: сначала отбираются записи, удовлетворяющие условиям первой строки, затем к ним добавляются записи, удовлетворяющие условиям второй строки, и т. д. В следующей таблице приведены примеры реализации логических выражений табличным методом, применяемым в конструкторе запросов. Использованы условия выбора из рассмотренного выше формального примера. Условие А В С 1)А=1 ИВ=2 = 1 =2 2)А=1 ИЛИ А=3 =1 =3 3)А=1 ИЛИ В=2 =1 =2 4) А=1 ИЛИ В=2 ИЛИ С=3 =1 =2 =3 5)А=1 ИВ=2 ИС=3 =1 =2 =3 6) НЕА=1 <>1 7) А=1 И В=2 ИЛИ С=3 =1 ^ =2 =3 8) А=1 ИЛИ В=2 И С=3 =1 =2 =3 9) НЕ А=1 ИЛИ В=2 И С=3 <>1 =2 =3 10) (А=1 ИЛИ В=2) И С=3 =1 =3 =2 =3 см. продолжение 190 Глава 5. Технологии использования и разработки информационных систем Продолжение таблицы Условие \1)В>=А >=[А] 12)В>=АИ5>=С >=[А] AND >=[С] 13)А=В ИЛИ А=С =[В] OR =[С] 14) С=А+В =[^]+[В] Обратите внимание на условие в примере 10. При записи в таблицу фактически произошло раскрытие скобок и данное логическое выражение заменилось эквивгшентным выражением: А=1 И С=3 ИЛИ В=2 И С=3 Имя поля, заключенное в квадратные скобки, идентифицирует значение этого поля в записи. Такое обозначение в принципе можно использовать во всех условных выражениях в конструкторе. Например, отношение А=1 в конструкторе запроса в столбце А можно записать в двух вариантах: 1) [А]=1, 2) =1. Второй вариант короче, поэтому обычно пользуются им. Условие в примере 13 можно было бы записать так: [А]=[В]ОК[А]=[С]. Система основных понятий Условия выбора данных Условие выбора — логическое выражение Простое логическое выражение Сложное (составное) логическое выражение Операция отношения или логическое поле Отношения + логические поля + логические операции Основные логические операции НЕ (отрицание) И (логическое умножение (конъюнкция)) ИЛИ (логическое сложение (дизъюнкция)) В конструкторе запросов (Access) — табличная форма представления условия выбора И объединяет условия в одной строке ИЛИ объединяет условия в разных строках § 35. Логические условия выбора данных 191 Вопросы и задания 1. а) Что такое логическое выражение? б) Какие существуют основные логические операции? Что такое таблица истинности? 2. Для таблицы, приведенной в § 35, определите результаты отбора записей по следующим условиям: а) А=2 И В=2 б) А=2 ИЛИ Б=2 в) А=2 ИВ=1 ИЛИ С=3 г) А>В д) С=А+В е) А=1ИЛИА=2 ж) Б>1 ИБ<3. 3. Все условия из предыдущего задания представьте в табличной форме, т. е. на языке конструктора запросов. Глава 6____________________ Технологии информационного моделирования Моделирование зависимостей между величинами Величины и зависимости между ними Содержание данного раздела учебника связано с компьютерным математическим моделированием. Применение математического моделирования постоянно требует учета зависимостей одних величин от других. Приведем примеры таких зависимостей: 1) время падения тела на землю зависит от его первоначальной высоты; 2) давление газа в баллоне зависит от его температуры; 3) уровень заболеваемости жителей города бронхиальной астмой зависит от концентрации вредных примесей в городском воздухе. Реализация математической модели на компьютере {компьютерная математическая модель) требует владения приемами представления зависимостей между величинами. Рассмотрим различные методы представления зависимостей. Всякое исследование нужно начинать с выделения количественных характеристик исследуемого объекта. Такие характеристики называются величинами. С понятием величины вы уже встречались в базовом курсе информатики. Напомним, что со всякой величиной связаны три основных свойства: имя, значение, тип. Имя величины может быть смысловым и символическим. Примером смыслового имени является «давление газа», а символическое имя для этой же величины — Р. В базах данных величинами являются поля записей. Для них, как правило, используются смысловые имена, например: ФАМИЛИЯ, ВЕС, ОЦЕНКА и т. п. В физике и других науках, использующих математический аппарат, применяются символические имена для обозначения величин. Чтобы не терялся смысл, для определенных величин используются стандартные имена. Например, время обозначают буквой t, скорость — V, силу — Р и пр. § 36. Моделирование зависимостей между величинами 193 Если значение величины не изменяется, то она называется постоянной величиной или константой. Пример константы — число Пифагора п = 3,14259... . Величина, значение которой может меняться, называется переменной. Например, в описании процесса падения тела переменными величинами являются высота Н и время падения t. Третьим свойством величины является ее тип. С понятием типа величины вы также встречались, знакомясь с программированием и базами данных. Тип определяет множество значений, которые может принимать величина. Основные типы величин: числовой, символьный, логический. Поскольку в данном разделе мы будем говорить лишь о количественных характеристиках, то и рассматриваться будут только величины числового типа. А теперь вернемся к примерам 1-3 и обозначим (поименуем) все переменные величины, зависимости между которыми нас будут интересовать. Кроме имен укажем размерности величин. Размерности определяют единицы, в которых представляются значения величин. 1) t (с) — время падения; Н (м) — высота падения. Зависимость будем представлять, пренебрегая учетом сопротивления воздуха; ускорение свободного падения g (м/с^) будем считать константой. 2) Р (н/м^) — давление газа (в единицах системы СИ давление измеряется в ньютонах на квадратный метр); f °С — температура газа. Давление при нуле градусов Ро будем считать константой для данного газа. 3) Загрязненность воздуха будем характеризовать концентрацией примесей (каких именно, будет сказано позже) — С (мг/м^). Единица измерения — масса примесей, содержащихся в 1 кубическом метре воздуха, выраженная в миллиграммах. Уровень заболеваемости будем характеризовать числом хронических больных астмой, приходящихся на 1000 жителей данного города — Р (бол./тыс.). Отметим важное качественное различие между зависимостями, описанными в примерах 1 и 2, с одной стороны, и в примере 3, с другой. В первом случае зависимость между величинами является полностью определенной: значение Н однозначно определяет значение t (пример 1), значение t однозначно определяет значение Р (пример 2). Но в третьем примере зависимость между значением загрязненности воздуха и уровнем заболеваемости носит существенно более сложный характер; при одном и том же уровне загрязненности в разные месяцы в одном и том же городе (или в разных городах в один и тот же месяц) уровень заболеваемости может быть разным, поскольку на него влияют и многие другие факторы. Отложим более детальное обсуждение этого примера до следующего параграфа, а пока лишь отметим, что на математическом языке зависимости в примерах 1 и 2 являются функциональными, а в примере 3 — нет. Математические модели Если зависимость между величинами удается представить в математической форме, то мы имеем математическую модель. 194 Глава 6. Технологии информационного моделирования Математическая модель — это совокупность количественных характеристик некоторого объекта (процесса) и связей между ними, представленных на языке математики. Хорошо известны математические модели для первых двух примеров. Они отражают физические законы и представляются в виде формул: t = 2Я, 1 g Р = Р. 1 + 273 Это примеры зависимостей, представленных в функциональной форме. Первую зависимость называют корневой (время пропорционально квадратному корню высоты), вторую — линейной. В более сложных задачах математические модели представляются в виде уравнений или систем уравнений. В конце данной главы будет рассмотрен пример математической модели, которая выражается системой неравенств. В ещ,е более сложных задачах (пример 3 — одна из них) зависимости тоже можно представить в математической форме, но не функциональной, а иной. Табличные и графические модели Рассмотрим примеры двух других, не формульных, способов представления зависимостей между величинами: табличного и графического. Представьте себе, что мы решили проверить закон свободного падения тела экспериментальным путем. Эксперимент организуем следующим образом: будем бросать стальной шарик с 6-метровой высоты, 9-метровой и т. д. (через 3 метра), замеряя высоту начального положения шарика и время падения. По результатам эксперимента составим таблицу и нарисуем график. Падение тела 3.0 2.5 1 1.5 01 а-1.0 0.5 0.0 m 10 20 Высота (м) 30 40 Рис. 6.1. Табличное и графическое представление зависимости времени падения тела от высоты § 36. Моделирование зависимостей между величинами 195 Если каждую пару значений if и ^ из данной таблицы подставить в приведенную выше формулу зависимости высоты от времени, то формула превратится в равенство (с точностью до погрешности измерений). Значит, модель работает хорошо. (Однако если сбрасывать не стальной шарик, а большой легкий мяч, то равенство не будет достигаться, а если надувной шарик, то значения левой и правой частей формулы будут различаться очень сильно. Как вы думаете, почему?) В этом примере мы рассмотрели три способа моделирования зависимости величин: функциональный (формула), табличный и графический. Однако математической моделью процесса падения тела на землю можно назвать только формулу. Формула более универсальна, она позволяет определить время падения тела с любой высоты, а не только для того экспериментального набора значений i/, который отображен на рис. 6.1. Имея формулу, можно легко создать таблицу и построить график, а наоборот — весьма проблематично. Точно так же тремя способами можно отобразить зависимость давления от температуры. Оба примера связаны с известными физическими законами — законами природы. Знания физических законов позволяют производить точные расчеты, они лежат в основе современной техники. Информационные модели, которые описывают развитие систем во времени, имеют специальное название: динамические модели. В примере 1 приведена именно такая модель. В физике динамические информационные модели описывают движение тел, в биологии — развитие организмов или популяций животных, в химии — протекание химических реакций ИТ. д. Система основных понятий Моделирование зависимостей между величинами Величина — количественная характеристика исследуемого объекта Характеристики величины Имя: Тип: Значение отражает смысл величины определяет возможные значения величины константа переменная Виды зависимостей: Функциональные Иные Способы отображения зависимостей Математическая модель Табличная модель Графическая модель Описание развития систем во времени — динамическая модель 196 Глава 6. Технологии информационного моделирования Вопросы и задания 1. а) Какие вам известны формы представления зависимостей между величинами? б) Что такое математическая модель? в) Может ли математическая модель включать в себя только константы? 2. Приведите пример известной вам функциональной зависимости (формулы) между характеристиками какого-то объекта или процесса. 3. Обоснуйте преимущества и недостатки каждой из трех форм представления зависимостей. Модели статистического прогнозирования о статистике и статистических данных Рассмотрим способ нахождения зависимости частоты заболеваемости жителей города бронхиальной астмой от качества воздуха (третий пример из сформулированных в начале предыдущего параграфа). Любому человеку понятно, что такая зависимость существует. Очевидно, чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять уровнем загрязненности воздуха. Для управления требуются более конкретные знания. Нужно установить, какие именно примеси сильнее всего влияют на здоровье людей, как связана концентрация этих примесей в воздухе с числом заболеваний. Такую зависимость можно установить только экспериментальным путем: посредством сбора многочисленных данных, их анализа и обобщения. При решении таких проблем на помощь приходит: Статистика — наука о сборе, измерении и анализе массовых количественных данных. Существуют медицинская статистика, экономическая статистика, социальная статистика и другие. Математический аппарат статистики разрабатывает наука под названием математическая статистика. Рассмотрим пример из области медицинской статистики. Известно, что наиболее сильное влияние на бронхиально-легочные заболевания оказывает угарный газ — оксид углерода. Поставив цель определить эту зависимость, специалисты по медицинской статистике проводят сбор данных. Они собирают сведения из разных городов о средней концентрации угарного газа в атмосфере и о заболеваемости астмой (число § 37. Модели статистического прогнозирования 197 хронических больных на 1000 жителей). Полученные данные можно свести в таблицу, а также представить в виде точечной диаграммы (рис. 6.2 ). С, Р, мг/м** бол./тыс. 2 19 2,5 20 2,9 32 3,2 34 3,6 51 3,9 55 4,2 90 4,6 108 5 171 Заболеваемость астмой о т Ф I ° I 200 .S 150 0) т 100 X 50 ♦ *■ 4 4 -4-^ 0 2 4 6 Концентрация угарного газа (мг/куб .м ) Рис. 6.2. Табличное и графическое представление статистических данных Статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер, но верно отражают характер зависимости величин. И еще одно важное замечание: для достоверности результатов, полученных путем анализа статистических данных, этих данных должно быть много. Из полученных данных можно сделать вывод, что при концентрации угарного газа до 3 мг/м^ его влияние на заболеваемость астмой несильное. С дальнейшим ростом концентрации наступает резкий рост заболеваемости. А как построить математическую модель данного явления? Очевидно, нужно получить формулу, отражающую зависимость количества хронических больных Р от концентрации угарного газа С. На языке математики это называется функцией зависимости Р от С: Р(С). Вид такой функции неизвестен, ее следует искать методом подбора по экспериментальным данным. Понятно, что график искомой функции должен проходить близко к точкам диаграммы экспериментальных данных. Строить функцию так, чтобы ее график точно проходил через все данные точки (рис. 6.3, а), не имеет смысла. Во-первых, математический вид такой функции может оказаться слишком сложным. Во-вторых, уже говорилось о том, что экспериментальные значения являются приближенными. Отсюда следуют основные требования к искомой функции: • она должна быть достаточно простой для использования ее в дальнейших вычислениях; * Приводимые в примере данные не являются официальной статистикой, однако правдоподобны. 198 Глава 6. Технологии информационного моделирования график этой функции должен проходить вблизи экспериментальных точек так, чтобы отклонения этих точек от графика были минимальны и равномерны (рис. 6.3,6). Рис. 6.3. Два варианта построения графической зависимости по экспериментальным данным Полученную функцию, график которой приведен на рис. 6.3, 6, в статистике принято называть регрессионной моделью. Метод наименьших квадратов Получение регрессионной модели происходит в два этапа: 1) подбор вида функции; 2) вычисление параметров функции. Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них. Чаще всего выбор производится среди следующих функций: у = ах+ Ъ — линейная функция; у = ах^ ^-Ьх + с — квадратичная функция; у = а 1п(л:) + Ь — логарифмическая функция; у = — экспоненциальная функция; у = ах^ — степенная функция. Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например полином третьей степени имеет вид: у = ах^ + Ъх^ + сх + d. Во всех этих формулах х — аргумент, у — значение функции, а, 6, с, d — параметры функции, In(jc) — натуральный логарифм, е — константа, основание натурального логарифма. Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, 6, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит «располагалась как можно ближе»? Ответить на этот вопрос значит предложить метод вычисления параметров. Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он назы- § 37. Модели статистического прогнозирования 199 вается методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений ^-координат всех экспериментальных точек от ^-координат графика функции была минимальной. Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 6.4 изображены три функции, построенные методом наименьших квадратов по приведенным экспериментальным данным. Рис. 6.4. Три функции, построенные по МНК Данные рисунки получены с помощью табличного процессора Microsoft Excel. График регрессионной модели называется трендом. Английское слово «trend» можно перевести как «общее направление», или «тенденция». Уже с первого взгляда хочется отбраковать вариант линейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды правдоподобны. Теперь пора 200 Глава 6. Технологии информационного моделирования обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции - регрессионные модели: линейная функция: экспоненциальная функция: квадратичная функция: у = 46,361д:-99,881; у = 3,4302 у = 21,845*^ - 106,97* + 150,21, На графиках присутствует еще одна величина, полученная в результате построения трендов. Она обозначена как В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если о, то выбранный вид регрессионной модели предельно неудачен. Чем ближе к 1, тем удачнее регрессионная модель. Из трех выбранных моделей значение R^‘ наименьшее у линейной. Значит, она самая неудачная (нам и так это было понятно). Значения же R^ у двух других моделей достаточно близки (разница меньше 0,01). Если определить погрешность решения данной задачи как 0,01, по критерию R^‘ эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные соображения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при больших величинах, то, глядя на графики, предпочтение следует отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси. Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести «на глаз» прямую так, чтобы точки были равномерно разбросаны вокруг нее, то он проведет линию, достаточно близкую к той, что дает МНК. Прогнозирование по регрессионной модели Мы получили регрессионную математическую модель и можем прогнозировать процесс путем вычислений. Теперь можно оценить уровень заболеваемости астмой не только для тех значений концентрации угарного газа, которые были получены путем измерений, но и для других значений. Это очень важно с практической точки зрения. Например, если в городе планируется построить завод, который будет выбрасывать в атмосферу угарный газ, то, рассчитав его возможную концентрацию, можно предсказать, как это отразится на заболеваемости астмой жителей города. Существует два способа прогнозов по регрессионной модели. Если прогноз производится в пределах экспериментальных значений независимой переменной (в нашем случае это концентрация угарного газа С), то это называется восстановлением значения. Прогнозирование за пределами экспериментальных данных называется экстраполяцией. Имея регрессионную модель, легко прогнозировать, производя расчеты с помощью электронных таблиц. Выберем для нашего примера в ка- § 37. Модели статистического прогнозирования 201 честве наиболее подходящей квадратичную зависимость. Построим следующую электронную таблицу: А В 1 Концентрация угарного газа ( мг/куб. м ) Число больных астмой на 1 тыс. жителей 2 =21,845*А2*А2-106,97*А2+150,21 Подставляя в ячейку А2 значение концентрации угарного газа, в ячейке В2 будем получать прогноз заболеваемости. Вот пример восстановления значения: А В 1 Концентрация угарного газа Число больных астмой на 1 тыс. ( мг/куб. м ) жителей 2 3 25 Заметим, что число, получаемое по формуле в ячейке В2, на самом деле является дробным. Однако не имеет смысла считать число людей, даже среднее, в дробных величинах. Дробная часть удалена — в формате вывода числа указано 0 цифр после запятой. Экстраполяционный прогноз выполняется аналогично. Табличный процессор дает возможность производить экстраполяцию графическим способом, продолжая тренд за пределы экспериментальных данных. Как это выглядит при использовании квадратичного тренда для С = 7, показано на рис. 6.5. В ряде случаев с экстраполяцией надо быть осторожным. Применимость всякой регрессионной модели ограничена, особенно за пределами Рис. 6.5. Квадратичный тренд с экстраполяцией 202 Глава 6. Технологии информационного моделирования экспериментальной области. В нашем примере при экстраполяции не следует далеко уходить от величины 5 мг/м^. Вполне возможно, что далее характер зависимости супд^ественно меняется. Слишком сложной является система «экология — здоровье человека», в ней много различных факторов, которые связаны друг с другом. Полученная регрессионная функция является всего лишь моделью, экспериментально подтвержденной в диапазоне концентраций от 2 до 5 мг/м^. Что будет вдали от этой области, мы не знаем. Всякая экстраполяция держится на гипотезе: «предположим, что за пределами экспериментальной области закономерность сохраняется». А если не сохраняется? Квадратичная модель в данном примере в области малых значений концентрации, близких к о, вообп^е не годится. Экстраполируя ее на С = о мг/м^, получим 150 человек больных, т. е. больше, чем при 5 мг/м^. Очевидно, это нелепость. В области малых значений С лучше работает экспоненциальная модель. Кстати, это довольно типичная ситуация: разным областям данных могут лучше соответствовать разные модели. Система основных понятий Модели статистического прогнозирования Статистика: наука о сборе, измерении и анализе массовых количественных данных Статистические данные Приближенный характер Требуют многократных измерений Регрессионная модель Описывает зависимость между количественными характеристиками сложных систем Вид регрессионной функции определяется подбором по экспериментальным данным Может использоваться для прогнозирования Метод наименьших квадратов Используется для вычисления параметров регрессионной модели Вид регрессионной модели задает пользователь Содержится в математическом арсенале электронных таблиц Вопросы и задания 1. а) Что такое статистика? б) Являются ли результаты статистических расчетов точными? в) Что такое регрессионная модель? 2. Какие из следующих величин можно назвать статистическими; температура вашего тела в данный момент, средняя температура в вашем регионе за последний месяц; максимальная скорость, развиваемая данной моделью автомобиля; среднее число осадков, выпадающих в вашем регионе в течение года? § 38. Моделирование корреляционных зависимостей 203 3. а) Для чего используется метод наименьших квадратов? б) Что такое тренд? в) Как располагается линия тренда, построенная по МНК, относительно экспериментальных точек? г) Может ли тренд, построенный по МНК, пройти выше всех экспериментальных точек? 4. а) В чем смысл параметра Какие значения он принимает? б) Какое значение примет параметр если тренд точно проходит через экспе- риментальные точки? 5. По данным из следуюш;ей таблицы постройте с помощью Excel линейную, квадратичную, экспоненциальную и логарифмическую регрессионные модели. Определите параметры, выберите лзшшую модель. X 2 4 6 8 10 12 14 16 18 20 22 24 26 28 у 44 32 35 40 30 27 21 25 20 23 18 19 20 16 6. а) Что подразумевается под восстановлением значения по регрессионной модели? б) Что такое экстраполяция? 7. Соберите данные о средней дневной температуре в вашем городе за последнюю неделю (10 дней, 20 дней). Оцените (хотя бы на глаз), годится ли использование линейного тренда для описания характера изменения температуры со временем. Попробуйте путем графической экстраполяции предсказать температуру через 2-5 дней. 8. Придумайте свои примеры практических задач, для которых имело бы смысл выполнение восстановления значений и экстраполяционных расчетов. Моделирование корреляционных зависимостей Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А. На него могут оказывать влияние одновременно многие другие факторы: В, С, Z) и т. д. Мы рассмотрим два типа задач: 1) определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А? 2) какие из факторов В, С, В и т. д. оказывают наибольп1ее влияние на фактор А? В качестве примера сложной системы будем рассматривать школу. Пусть для первого типа задач фактором А является средняя успеваемость учащихся школы, фактором В — финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. Здесь влияние фактора В на фактор А не очевид- 204 Глава 6. Технологии информационного моделирования НО. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квЕшификации учителей, контингент учащихся, уровень технических средств обучения и др. СпециЕшисты по статистике знают, что для того, чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая информацию из разных школ, нужно выбирать такие школы, в которых приблизительно одинаковый контингент учеников, квЕшификация учителей и пр., но хозяйственные расходы разные (у одних школ могут быть богатые спонсоры, у других — нет). Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб./чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года. Еще раз обращаем ваше внимание на то, что в статистических расчетах обычно используются относительные и усредненные величины. Итоги сбора данных по 20 школам, введенные в электронную таблицу, представлены на рис. 6.6. На рис. 6.7 приведена точечная диаграмма, построенная по этим данным. А В С № п/п Затраты (руб./чел.) Успеваемость (средний балл) 1 50 3,81 2 345 4,13 3 79 4,30 4 100 3,96 5 203 3,87 6 420 4,33 7 210 4 8 137 4,21 9 463 4,4 10 231 3,99 11 134 3,9 12 100 4,07 13 294 4,15 14 396 4,1 15 77 3,76 16 480 4,25 17 450 3,88 18 496 4,50 19 102 4,12 20 150 4,32 Рис. 6.6. Статистические данные § 38. Моделирование корреляционных зависимостей 205 Хозяйственные расходы 4.6 4,5 4,4 4,3 4,:^ 4,1 4 Э,9 3,8 3.7 О 200 400 Затраты (руб/чел) 600 Рис. 6.7. Точечная диаграмма Значения обеих величин: финансовых затрат и успеваемости учеников — имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне может существовать. Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями. Раздел математической статистики, который исследует такие зависимости, называется корреляционным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости. Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым этот коэффициент вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе достаточно знать следующее: • коэффициент корреляции (обычно обозначаемый греческой буквой р) есть число из диапазона от -1 до -Ы; • если это число по модулю близко к 1, то имеет место сильная корреляция, если к О, то слабая; • близость р к -Ы означает, что возрастанию значений одного набора соответствует возрастание значений другого набора, близость к -1 означает, что возрастанию значений одного набора соответствует убывание значений другого набора; • значение р легко найти с помощью Excel, так как в эту программу встроены соответствующие формулы. 206 Глава 6. Технологии информационного моделирования В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит в группу статистических функций. Покажем, как ею воспользоваться. На том же листе Excel, где находится таблица, представленная на рис. 6.6, надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем, соответственно, В2;В21 и С2:С21. После их ввода будет выведен ответ: р 0,500273843. Эта величина говорит о среднем уровне корреляции. Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удовольствием ходят в чистую, красивую, уютную школу, чувствуют там себя, как дома, и поэтому лучше учатся. В следуюпдем примере проводится исследование по определению зависимости успеваемости учапдихся старших классов от двух факторов: обеспеченности школьной библиотеки учебниками и оснаш;ения школы компьютерами. И та, и другая характеристика количественно выражается в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, т. е. такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги. Нормой оснаш,ения компьютерами будем считать такое их количество, при котором на каждых четырех старшеклассников в школе приходится один компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на других уроках, а также во внеурочное время. В таблице, изображенной на рис. 6.8, приведены результаты измерения обоих факторов в 11 разных школах. Напомним, что влияние каждого фактора исследуется независимо от других (т. е. влияние других супдественных факторов должно быть приблизительно одинаковым). Обеспечение учебного процесса № Обеспеченность учебниками (%) Успеваемость (средний балл) Обеспеченность компьютерами (%) Успеваемость (средний балл) 1 50 3,81 10 3,98 2 78 4,15 25 4,01 3 94 4,69 19 4,34 4 65 4,37 78 4,41 5 99 4,53 45 3,94 6 87 4,23 32 3,62 7 100 4,73 90 4,6 8 63 3,69 21 4,24 9 79 4,08 34 4,36 10 94 4,2 45 3,99 11 93 4,32 67 4,5 р= 0,780931 р = 0,572465 Рис. 6.8. Сравнение двух корреляционных зависимостей § 39. Модели оптимального планирования 207 Для обеих зависимостей получены коэффициенты линейной корреляции. Как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успеваемостью (хотя и тот, и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний, чем компьютер. Система основных понятий Корреляционные зависимости Это зависимости между величинами, каждая из которых ______подвергается неконтролируемому разбросу____ Корреляционный анализ дает возможность: определить, оказывает ли один фактор существенное влияние на другой фактор выбрать из нескольких факторов наиболее существенный Коэффициент корреляции р : количественная мера корреляции р по модулю близко к единице — сильная корреляция р близко к нулю — слабая корреляция Расчет р возможен в Microsoft Excel с помощью программы КОРРЕЛ Вопросы и задания 1. а) Что такое корреляционная зависимость? б) Что такое корреляционный анализ? в) Какие типы задач можно решать с помощью корреляционного анализа? г) Какая величина является количественной мерой корреляции? Какие значения она может принимать? 2. С помощью какого средства табличного процессора Excel можно вычислить коэффициент корреляции? 3. а) Для данных из таблицы, представленной на рис. 6.8, постройте две линейные регрессионные модели. б) Для этих же данных вычислите коэффициенты корреляции. Сравните с приведенными на рис. 6.8 результатами. Модели оптимального планирования Проблема, к обсуждению которой мы теперь переходим, называется оптимальным планированием. Объектами планирования могут быть самые разные системы: деятельность отдельного предприятия, отрасли про- 208 Глава 6. Технологии информационного моделирования мышленности или сельского хозяйства, региона, наконец государства. Постановка задачи планирования выглядит следующим образом: • имеются некоторые плановые показатели: X, У, и др.; • имеются некоторые ресурсы: R1, R2 и др., за счет которых эти плановые показатели могут быть достигнуты. Эти ресурсы практически всегда ограничены; • имеется определенная стратегическая цель, зависящая от значений X, У и др. плановых показателей, на которую следует ориентировать планирование. Нужно определить значение плановых показателей с учетом ограниченности ресурсов при условии достижения стратегической цели. Это и будет оптимальным планом. Приведём примеры. Пусть объектом планирования является детский сад. Ограничимся лишь двумя плановыми показателями: количеством детей и количеством воспитателей. Основными ресурсами деятельности детского сада являются объем финансирования и площади помещения. А каковы стратегические цели? Естественно, одной из них является сохранение и укрепление здоровья детей. Количественной мерой такой цели является минимизация заболеваемости воспитанников детского сада. Другой пример: планирование экономической деятельности государства. Безусловно, это слишком сложная задача для того, чтобы нам с ней полностью разобраться. Плановых показателей очень много: это производство различных видов промышленной и сельскохозяйственной продукции, подготовка специалистов, выработка электроэнергии, размер зарплаты работников бюджетной сферы и многое другое. К ресурсам относятся: количество работоспособного населения, бюджет государства, природные ресурсы, энергетика, возможности транспортных систем и пр. Как вы понимаете, каждый из этих видов ресурсов ограничен. Кроме того, важнейшим ресурсом является время, отведенное на выполнение плана. Вопрос о стратегических целях довольно сложный. У государства их много, но в разные периоды истории приоритеты целей могут меняться. Например, в военное время главной целью является максимальная обороноспособность, военная мощь страны. В мирное время в современном цивилизованном государстве приоритетной целью должно быть достижение максимального уровня жизни населения. Если мы хотим использовать компьютер для решения задачи оптимального планирования, то нам снова нужно построить математическую модель. Следовательно, все, о чем говорилось в примерах, должно быть переведено на язык чисел, формул, уравнений и других средств математики. В полном объеме для реальных систем эта задача очень сложная. Как и раньше, мы пойдем по пути упрощения. Рассмотрим очень простой пример, из которого вы получите представление об одном из подходов к решению задачи оптимального планирования. Пример. Школьный кондитерский цех готовит пирожки и пирожные. В силу ограниченности емкости склада за день можно приготовить в сово- § 39. Модели оптимального планирования 209 купности не более 700 штук изделий. Рабочий день в кондитерском цехе длится 8 часов. Поскольку производство пирожных более трудоемко, то если выпускать только их, за день можно произвести не более 250 штук, пирожков же можно произвести 1000 штук (если при этом не выпускать пирожных). Стоимость пирожного вдвое выше, чем стоимость пирожка. Требуется составить такой дневной план производства, чтобы обеспечить наибольшую выручку кондитерского цеха. Разумеется, это чисто учебный пример. Вряд ли супцествует такой кондитерский цех, который выпускает всего два вида продукции, да и наибольшая выручка — не единственная цель его работы. Но зато математически формулировка задачи будет простой. Давайте ее выработаем. Плановыми показателями являются: • X — дневной план выпуска пирожков; • г/ — дневной план выпуска пирожных. Что в этом примере можно назвать ресурсами производства? Из того, о чем говорится в условии задачи, это: • длительность рабочего дня — 8 часов; • вместимость складского помепцения — 700 мест. Предполагается для простоты, что другие ресурсы (сырье, электроэнергия и пр.) не ограничены. Формализацию цели (достижение максимальной выручки цеха) мы обсудим позже. Получим соотношения, следуюш;ие из условий ограниченности времени работы цеха и вместимости склада, т. е. суммарного числа изделий. Из постановки задачи следует, что на изготовление одного пирожного затрачивается в 4 раза больше времени, чем на выпечку одного пирожка. Если обозначить время изготовления пирожка как t мин, то время изготовления пирожного будет равно мин. Значит, суммарное время на изготовление X пирожков и у пирожных равно tx + 4ty = (х + 4y)t. Но это время не может быть больше длительности рабочего дня. Отсюда следует неравенство; (х -Н 4y)t <8-60, или (х + 4y)t < 480. Легко посчитать t — время изготовления одного пирожка. Поскольку за рабочий день их может быть изготовлено 1000 штук, то на один пирожок тратится 480/1000 = 0,48 мин. Подставляя это значение в неравенство, получим: Отсюда {х + 4г/)х0,48 < 480. х + 4у< 1000. 210 Глава 6. Технологии информационного моделирования Ограничение на общее число изделий дает совершенно очевидное неравенство: X + у< 700. К двум полученным неравенствам следует добавить условия положительности значений величин х тл.у (не может быть отрицательного числа пирожков и пирожных). В итоге получим систему неравенств: х + ^ < 1000; х+у < 700; д: > 0; у>0. (1) А теперь перейдем к формализации стратегической цели: получению максимальной выручки. Выручка — это стоимость всей проданной продукции. Пусть цена одного пирожка — г рублей. По условию задачи, цена пирожного в два раза больше, т. е. 2г рублей. Отсюда стоимость всей произведенной за день продукции равна гх + 2гу = г(х + 2у). Целью производства является получение максимальной выручки. Будем рассматривать записанное выражение как функцию от х, у: F(x, у) = г(х + 2у). Она называется целевой функцией. Поскольку значение г — константа, то максимальное значение F(x, у) будет достигнуто при максимальной величине выражения (х + 2у). Поэтому в качестве целевой функции можно принять fix, у) = х + 2у. (2) Следовательно, получение оптимального плана свелось к следующей математической задаче: Требуется найти значения плановых показателей х и у, удовлетворяющих данной системе неравенств (1) и придающих максимальное значение целевой функции (2). Итак, математическая модель задачи оптимального планирования для школьного кондитерского цеха построена. Теперь следующий вопрос: как решить эту задачу? Вы уже догадываетесь, что решать ее за нас будет компьютер с помощью табличного процессора Excel. А мы обсудим лишь подход к решению, не вникая в подробности метода. Математическая дисциплина, которая посвящена решению таких задач, называется математическим программированием. А поскольку в целевую функцию fix, у) величины xviy входят линейно (т. е. в первой степени), то наша задача относится к разделу этой науки, который называется линейным программированием. § 39. Модели оптимального планирования 211 Система написанных выше неравенств представляется на координатной плоскости четырехугольником, ограниченным четырьмя прямыми, соответствующими линейным уравнениям: х + 4у= 1000, х + у = 700, х = 0 (ось Y), у = 0 (ось X). На рис. 6.9 эта область представляет собой четырехугольник ABCD и выделена заливкой. Любая точка четырехугольника является решением системы нергшенств (1). Например, х = 200, у = 100. Этой точке соответствует значение целевой функции /(200, 100) = 400. А другой точке {х = 600, у = 50) соответствует /(600, 50) = 700. Но, очевидно, искомым решением является та точка области ABCD, в которой целевая функция максимальна. Нахождение этой точки производится с помощью методов линейного программирования. В математическом арсенале Excel имеется средство Поиск решения. Как решать данную задачу с помощью этого средства, вы узнаете из компьютерного практикума. В результате решения задачи получается следующий оптимальный план дневного производства кондитерского цеха: нужно выпускать 600 пирожков и 100 пирожных. Эти плановые показатели соответствуют координатам точки В на рис. 6.9. В этой точке значение целевой функции /(600, 100) = 800. Если один пирожок стоит 5 рублей, то полученная выручка составит 4000 рублей. 212 Глава 6. Технологии информационного моделирования Система основных понятий Модели оптимального планирования Оптимальное планирование — определение значений плановых показателей с учетом ограниченности ресурсов при условии достижения заданной цели Ограниченность ресурсов описывается: системой неравенств системой равенств смешанной системой Цель описывается функцией, для которой требуется наити минимум наити максимум Microsoft Excel имеет специальное средство Поиск решения для решения задач оптимального планирования Вопросы и задания 1. а) в чем состоит задача оптимального планирования? б) Что такое плановые показатели, ресурсы, стратегическая цель? Приведите примеры. 2. а) Попробуйте сформулировать содержание оптимального планирования для своей учебной деятельности. б) Что такое математическое программирование, линейное программирование? 3. а) Сформулируйте задачу оптимального планирования для школьного кондитерского цеха, в котором выпускается три вида продукции: пирожки, пирожные и коржики. б) Внесите изменение в постановку задачи оптимального планирования из этого параграфа для двух видов продукции с учетом еще одного ограничения: число пирожных должно быть не меньше числа пирожков. На координатной плоскости постройте область поиска решения. Глава 7________________________ Основы социальной информатики Развитие информационных и коммуникационных технологий оказгшо сильнейшее влияние на все стороны жизни человеческого обш;ества. Это влияние имеет дгшеко идуш;ие последствия, изменяюш;ие отношения между людьми, социальными и общ;ественными группами и государствами. Изучением этих проблем занимается социальная информатика, с некоторыми разделами которой вы познакомитесь в данной главе. Информационные ресурсы Что такое информационные ресурсы Традиционными видами общ;ественных ресурсов являются материальные, сырьевые (природные), энергетические, трудовые, финансовые ресурсы, В дополнение к этому, одним из важнейших видов ресурсов современного обш;ества являются информационные ресурсы. Со временем значимость информационных ресурсов возрастает; одно из свидетельств этого заключается в том, что они становятся товаром, совокупная стоимость которого на рынке сопоставима со стоимостью традиционных ресурсов. Суш;ествуют разные подходы к понятию «информационные ресурсы». Юридическая формула, принятая в Федергшьном законе «Об информации, информатизации и заприте информации», гласит: «Информационные ресурсы — отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах {библиотеках, архивах, фондах, банках данных, других информационных системах)». Это определение дает юридическое основание для решения проблемы охраны информационных ресурсов. Вместе с тем, как и многие юридические формулы, данное определение сильно сужает понятие, которое большинством людей воспринимается гораздо шире. Здесь нет противоречия, просто не все в жизни можно измерить точными формулами. На самом деле, при более широком подходе к информационным ресурсам уместно относить все научно-технические знания, произведения литературы и искусства, множество иной информа- 214 Глава 7. Основы социальной информатики ции общественно-государственной значимости, зафиксированной в любой форме, на любом носителе информации, включая, разумеется, и те, о которых сказано в законе. Информационные ресурсы общества в настоящее время рассматриваются как стратегические ресурсы^ аналогичные по значимости материальным, сырьевым, энергетическим, трудовым и финансовым ресурсам. Однако между информационными ресурсами и всякими иными существует одно важнейшее различие: Всякий ресурс, кроме информационного, после использования исчезает. Сжигается топливо, расходуются финансы и т. п., а информационный ресурс остается «неуничтожаемым», им можно пользоваться многократно, он копируется без ограничений. Национальные информационные ресурсы Любая классификация информационных ресурсов общества оказывается неполной. В основу классификации можно положить: • отраслевой принцип (по виду науки, промышленности, социальной сферы ИТ. п., к чему относится информация); • форму представления (по виду носителей, степени формализован-ности, наличию дополнительного описания и пр.). Внутри каждого класса можно проводить дополнительное, более детальное разделение. Например, ресурсы Интернета можно разделять по их назначению и по формам представления: сервисная информация, библиографическая информация, материалы телеконференций, программное обеспечение, видео и т. д. Один из способов классификации национальных информационных ресурсов представлен на рис. 7.1. Прокомментируем его. Огромные информационные ресурсы скрыты в библиотеках. Доминируют традиционные (бумажные) формы их представления, но все больше библиотечных ресурсов в последние годы переводится на цифровую (безбумажную) основу. Архивы скрывают материалы (иногда многовековые), связанные с историей и культурой страны. Объемы архивных материалов огромны и накапливаются зачастую быстрее, чем их удается обрабатывать. Во всех развитых странах существуют специализированные системы научно-технической информации. Они включают многочисленные специальные издания, патентные службы и т. д. Информация такого рода часто является дорогостоящим товаром. Своды законов, кодексы, нормативные акты, другие виды правовой информации — без этого не может жить ни одно государство. Свои отраслевые информационные ресурсы имеются у любой социальной, промышленной, аграрной и иной сферы общества. Огромны информационные ресурсы оборонной сферы, системы образования и т. д. § 40. Информационные ресурсы 215 Рис. 7.1. Состав национальных информационных ресурсов Не будем комментировать далее, тем более что рис. 7.1 не охватывает всех видов национальных информационных ресурсов. Отметим лишь, что само это понятие сформировалось не так давно, примерно четверть века назад, в ответ на растуш;ую зависимость развитых стран от объемов информации, уровня развития средств ее передачи и обработки. Рынок информационных ресурсов и услуг Обилие информационных ресурсов и возможность их представления в современном (цифровом) виде привели к появлению развитого рынка информационных ресурсов и услуг. В настояш;ее время во многих странах сформировался национальный рынок информационных ресурсов; видны и явные признаки соответствуюш;его мирового рынка. Этот рынок во многом подобен рынку традиционных ресурсов, поскольку имеет определенную номенклатуру товаров, в качестве которых на нем выступают информационные ресурсы. Такими товарами могут быть: • информация бытового характера о доступе к материальным товарам и услугам, их стоимости; • информация научно-технического характера (патенты, авторские свидетельства, научные статьи и т. д.); • информационные технологии, компьютерные программы; • базы данных, информационные системы и многое другое. 216 Глава 7. Основы социальной информатики Как и на всяком рынке, на рынке информационных ресурсов есть поставщики (продавцы) и потребители (покупатели). Поставщики — это, как правило, производители информации или ее собственники. Ими бывают: • центры, в которых создаются и хранятся базы данных; • службы связи и телекоммуникации; • бытовые службы; • специализированные коммерческие фирмы, занимающиеся куплей-продажей информации (например, рекламные агентства); • неспециализированные фирмы, выпускающие материальные товары и в качестве дополнительной продукции — информацию о них; • консалтинговые (консультационные) фирмы; • биржи; • частные лица и пр. Потребители информации — это мы все, частные лица, а также предприятия, которые сегодня без информации не смогли бы функционировать, как и без поставки сырья; органы власти всех уровней и т. д. Информационные услуги — особый вид товара на информационном рынке. Примером информационной услуги является выполняемый многими библиотеками подбор литературы по тематике заказчика. Причем кроме поиска той литературы, которая есть в библиотеке, ее работники могут выполнить и более широкий поиск, чтобы дать клиенту исчерпывающие сведения. Информационные услуги возможны при наличии баз данных по соответствующей проблематике (в компьютерном или некомпьютерном варианте). Информационные услуги оказывают не только библиотеки. Во многих странах мира (в том числе и в России) существуют специальные институты, которые обрабатывают информацию по многим областям знаний и готовят по ней обзоры, рефераты, краткую информацию для специалистов. Без таких услуг деятельность ученых и специалистов трудно себе представить. В сфере бизнеса информационные услуги включают предоставление определенной деловой информации, консультации по определенной тематике и т. д. В сфере коммуникаций информационные услуги оказывают операторы связи, провайдеры Интернета (т. е. организации, осуществляющие за плату доступ пользователей и их обслуживание). Некоторые формы образования можно рассматривать как информационные услуги. Это, например, повышение квалификации, дополнительное образование и пр. У 4- - -^ т- § 40. Информационные ресурсы 217 Уровень развития сферы информационных услуг во многом определяет степень приближенности к информационному обществу. Рынок информационных ресурсов и услуг в своем развитии прошел несколько стадий. Его активное формирование совпало во времени с появлением первых ЭВМ, т. е. с началом 50-х годов XX века. Это совпадение явилось, в значительной мере, случайным, так как первые ЭВМ еш;е не создавали информационной инфраструктуры. В то время бурный расцвет науки и техники привел к созданию первых профессиональных информационных служб для этих областей, и соответствуюш;ий рынок был ориентирован на узкий слой ученых и специалистов. По-настоящему рынок информационных ресурсов и услуг расцвел после широкого внедрения микрокомпьютеров и основанных на их использовании телекоммуникационных систем. Кроме того, решающее значение для формирования рынка имело создание баз данных по множеству направлений знаний и человеческой деятельности. Процесс этот принял массовый характер в 80-х годах ушедшего века. К этому времени появились первые признаки глобализации данного рынка, начался международный обмен на нем ресурсами и услугами. Ведущими странами на рынке информационных ресурсов и услуг в настоящее время являются США, Япония и ряд стран Западной Европы. В России в настоящее время имеется вполне сформировавшийся информационный рынок (хотя по объему предлагаемых услуг он пока уступает аналогичным рынкам экономически высокоразвитых стран). Важнейшими компонентами отечественного рынка информационных услуг являются данные об информационном оборудовании, компьютерах, компьютерных сетях и соответствующих технологиях. Немалую часть предлагаемых товаров составляют справочные системы разного назначения. Существуют специальные службы обработки информации по заказу клиентов, службы продажи билетов и т. д. Немало на этом рынке и финансовой, статистической информации, информации по образовательным услугам, организации досуга и др. Постепенно в российском обществе начинает формироваться понимание простой истины: если информация — товар, то за нее надо платить. В противном случае разрушается сама основа рынка. Например, рынок программного обеспечения в нашей стране мог бы быть гораздо более развитым, если бы не происходило массового «пиратского >> копирования программ. Подведем итоги 1. Информационные ресурсы — общественно значимая информация, находящаяся в хранилищах и получаемая из источников. 2. Информационные ресурсы стали товаром, совокупная стоимость которого на рынке сопоставима со стоимостью традиционных ресурсов. 3. Отличительная особенность информационных ресурсов от других видов ресурсов: информационные ресурсы не исчезают в результате их использования; они лишь накапливаются и видоизменяются. 218 Глава 7. Основы социальной информатики 4. Развитие компьютерных информационных технологий способствует формированию рынка информационных ресурсов. 5. Особый вид товара на информационном рынке — информационные услуги. К ним относятся: поиск и подбор информации, консалтинг, обучение, телекоммуникации и пр. 6. В наше время формируется мировой рынок информационных ресурсов и услуг на базе глобальных компьютерных сетей. 7. На базе компьютерных информационных технологий формируется национальный рынок информационных ресурсов. 8. Важной экономической задачей является закрепление товарно-денежных отношений на рынке информационных услуг России. Вопросы и задания 1. Что обозначает термин «ресурсы»? Какие бывают ресурсы? 2. Что такое информационные ресурсы? 3. Каким особым свойством обладают информационные ресурсы по сравнению с любыми другими? 4. Почему информационные ресурсы можно назвать товарами? 5. Почему информационные ресурсы относят к числу стратегических? 6. Что представляет собой рынок информгщионных ресурсов? 7. Кто на рынке информационных ресурсов выступает в роли продавца, а кто — покупателя? 8. Могли бы вы предложить на рынок информационных ресурсов какой-нибудь свой товар? Как бы вы его оценили? 9. Что относится к числу информационных услуг? 10. Придумайте новый вид информгщионных услуг. 11. Что является основой мирового рынка информгщионных ресурсов и услуг? Какие виды информгщионных услуг вы знаете? Пользовались ли вы ими лично? 12. Охаргжтеризуйте виды информационных ресурсов России. 13. С какими видами информационных ресурсов России вы лично сталкивались? Информационное общество В истории человечества несколько раз происходили настолько радикальные изменения в информационной области, что их можно назвать информационными революциями. Первая информационная революция связана с изобретением письменности. Письменность создала возможность для накопления и распространения знаний, для передачи знаний будущим поколениям. Цивилиза- § 41. Информационное общество 219 ции, освоившие письменность, развивались быстрее других, достигали более высокого культурного и экономического уровня. Примерами могут служить Древний Египет, страны Междуречья, Китай. Позднее переход от пиктографического и идеографического письма к алфавитному, сделавший письменность более доступной, в значительной степени способствовал смещению центров цивилизации в Европу (Греция, Рим). Вторая информационная революция {середина XVI в.) связана с изобретением книгопечатания. Стало возможным не только сохранять информацию, но и сделать ее массово доступной. Грамотность становится массовым явлением. Все это ускорило рост науки и техники, помогло промышленной революции. Книги перешагнули границы стран, что способствовало началу создания общечеловеческой цивилизации. Третья информационная революция {конец XIX в.) обусловлена прогрессом средств связи. Телеграф, телефон, радио позволили оперативно передавать информацию на любые расстояния. Эта революция не случайно совпала с периодом бурного развития естествознания. Четвертая информационная революция {70-е гг. XX в.) связана с появлением микропроцессорной техники и, в частности, персональных компьютеров. Вскоре после этого возникли компьютерные телекоммуникации, радикально изменившие системы хранения и поиска информации. Были заложены основы преодоления информационного кризиса (об этом будет сказано немного позже). Основные черты информационного общества Четвертая информационная революция дала толчок к столь существенным переменам в развитии общества, что для его характеристики появился новый термин — «информационное общество». Само название впервые возникло в Японии. Специалисты, предложившие этот термин, разъяснили, что он определяет общество, в котором в изобилии циркулирует высокая по качеству информация, а также есть все необходимые средства для ее хранения, распределения и использования. Информация легко и быстро распространяется по требованиям заинтересованных людей и организаций и выдается им в привычной для них форме. Стоимость пользования информационными услугами настолько невысока, что они доступны каждому. 220 Глава 7. Основы социальной информатики Академик В. А. Извозчиков предлагает следующее определение: «Будем понимать под термином «информационное» («компьютеризированное») общество то, во все сферы жизни и деятельности членов которого включены компьютер, телематика, другие средства информатики в качестве орудий интеллектуального труда, открывающих широкий доступ к сокровищам библиотек, позволяющих с огромной скоростью производить вычисления и перерабатывать любую информацию, моделировать реальные и прогнозируемые события, процессы, явления, управлять производством, автоматизировать обучение и т. д.». (Под «телематикой» здесь понимается обработка информации на расстоянии.) Не существует общепринятого критерия оценки полномасштабного информационного общества, однако известны попытки его формулирования. Интересный критерий предложил академик А. П. Ершов: о фазах продвижения к информационному обществу следует судить по совокупным пропускным способностям каналов связи. За этим стоит простая мысль: развитие каналов связи отражает и уровень компьютеризации, и объективную потребность общества во всех видах информационного обмена, и другие проявления информатизации. Согласно этому критерию, ранняя фаза информатизации общества наступает при достижении действующей в нем совокупной пропускной способности каналов связи, обеспечивающей развертывание достаточно надежной междугородной телефонной сети. Завершающая фаза — при возможности реализации надежного и оперативного информационного контакта между членами общества по принципу «каждый с каждым». На завершающей фазе пропускная способность каналов связи должна быть в миллион раз больше, чем в первой фазе. Согласно мнению ряда специалистов, США завершат в целом переход к информационному обществу к 2020 году, Япония и большинство стран Западной Европы — к 2030-2040 годам. Вхождение России в информационное общество имеет свои особенности, связанные с современным этапом ее развития. В России имеется ряд объективных предпосылок к переходу в состояние информационного общества. Среди них: быстрое развитие материальной базы информационной сферы, информатизация многих отраслей производства и управления, активное вхождение в мировое сообщество, подготовленность общественного сознания и др. Важно, что движение России к информационному обществу реализуется государством как стратегическая, приоритетная цель, достижению которой способствует достаточно высокий кадровый и научно-технический потенциал России. Проследим более детально существующие универсальные тенденции развития информационного общества. § 41. Информационное общество 221 Изменение структуры экономики и труда. Вторая половина XX века, благодаря информатизации, сопровождалась перетоком людей из сферы прямого материального производства в информационную сферу. Промышленные рабочие, составлявшие в середине XX века более 2/3 населения, сегодня в развитых странах составляют менее 1/3. Значительно разросся социальный слой, который называют «белыми воротничками», — люди наемного труда, не производящие непосредственно материальных ценностей, а занятые обработкой информации (в широком смысле): учителя, банковские служащие, программисты и т. д. Так, к 1980 г. в сельском хозяйстве США было занято 3% работающих, в промышленности — 20%, в сфере обслуживания — 30%, 48% людей было занято в информационной сфере. Самое главное, информатизация изменила и характер труда в традиционных отраслях промышленности. Появление робототехнических систем, повсеместное внедрение элементов микропроцессорной техники является основной причиной этого явления. Приведем впечатляющий пример: в станкостроительной отрасли в США в 1990 г. было занято 330 тысяч человек, а к 2005 году осталось 14 тысяч человек. Эго произошло за счет массового сокращения людей на сборочных линиях вследствие внедрения вместо них роботов и манипуляторов. Еще одна характерная черта в этой сфере — появление развитого рынка информационных ресурсов и услуг. Этот рынок включает секторы: • деловой информации (биржевая, финансовая, статистическая, коммерческая информация); • профессиональной информации (по отдельным профессиям, научно-техническая информация, доступ к первоисточникам); • потребительской информации (новости, всевозможные расписания, развлекательная информация); • услуг образования и др. Развитие и массовое использование информационных и коммуникационных технологий. В основе информационной революции лежит взрывное развитие информационных и коммуникационных технологий. В этом процессе отчетливо наблюдается и обратная связь: движение к информационному обществу резко ускоряет процессы развития указанных технологий, делая их широко востребованными. Однако сам по себе бурный рост производства средств вычислительной техники, начавшийся с середины XX века, не стал причиной перехода к информационному обществу. Компьютеры использовались сравнительно небольшим числом специалистов до тех пор, пока существовали обособленно. Важнейшим этапом на пути в информационное общество стало: • создание телекоммуникационной инфраструктуры, включающей в себя сети передачи данных; • появление огромных баз данных, доступ к которым через сети получили миллионы людей; • выработка единых правил поведения в сетях и поиска в них информации. 222 Глава 7. Основы социальной информатики Огромную роль в обсуждаемом процессе сыграло создание всемирной компьютерной сети Интернет. Сегодня она представляет собой колоссальную и быстро растущую систему, число пользователей которой к началу 2007 года превысило 1 миллиард человек. Необходимо отметить, что количественные характеристики Интернета устаревают быстрее, чем печатаются книги, в которых эти показатели приводятся. Скорость роста числа пользователей Сети достаточно устойчиво составляет порядка 20% в год. Первое место по количеству пользователей Интернета занимают США — примерно 200 миллионов американцев подключены к глобальной сети (все данные на начало 2007 года). На втором и третьем местах — Китай и Япония с 111 и 87 миллионами пользователей соответственно. В России количество подключенных к Интернету составляет 21,8 миллиона, что на 17,5% больше, чем в предшествующем году. Этот показатель позволил России занять 11-е место в рейтинге самых ин-тернетизированных стран, что является большим прогрессом по сравнению с ситуацией 5-10-летней давности. Следует, однако, учитывать, что «подключенный» не означает «регулярно пользующийся»; в статистике такого рода во всем мире есть трудности интерпретации данных. По некоторым показателям, связанным с Интернетом, наша страна находится в числе лидеров. Так, по числу пользователей оптоволоконными сетями Россия стоит на первом месте в Европе. Это объясняется тем, что при относительно позднем начале массовой интернетизации российским провайдерам было проще развивать новые и технологически более совершенные каналы доступа к Сети, чем модернизировать существующие. Информационные и коммуникационные технологии постоянно развиваются. Постепенно происходит универсализация ведущих технологий, т. е. вместо создания для решения каждой задачи собственной технологии разрабатываются мощные универсальные технологии, допускающие много вариантов использования. Хорошо вам знакомый пример — офисные системы программного обеспечения, в которых можно производить множество разнообразных действий — от простейшего набора текста до создания достаточно специальных программ (скажем, начисления заработной платы с помощью табличного процессора). Универсализации информационных технологий способствует широкое использование мультимедиа. Современная мультимедийная система способна объединить функции, например, компьютера, телевизора, радиоприемника, мультипроектора, телефона, автоответчика, факса, обеспечивая при этом и доступ к сетям передачи данных. Совершенствование компьютерной техники приводит к персонализации и миниатюризации устройств хранения информации. Крошечные, умещающиеся на ладони устройства, имеющие все функции персонального компьютера, позволяют человеку обзавестись собственным универсальным справочником, объем информации в котором сопоставим с объемом нескольких энциклопедий. Поскольку это устройство может быть подключено к сети, то оно же передает и оперативные данные — например, о погоде, текущем времени, состоянии пробок на дорогах и т. д. § 41. Информационное общество 223 Преодоление информационного кризиса. Информационный кризис — явление, которое стало заметным уже в начале XX века. Оно проявляется в том, что поток информации, который хлынул на человека, столь велик, что недоступен обработке в приемлемое время. Это явление имеет место и в научных исследованиях, и в технических разработках, и в обпдественно-политической жизни. В нашем усложняю-пдемся мире принятие решений становится все более ответственным делом, а оно невозможно без полноты информации. Ускорение накопления общего объема знаний происходит с удивительной быстротой. В начале XX века общий объем всей производимой человечеством информации удваивался каждые 50 лет, к 1950 году удвоение происходило каждые 10 лет, к концу XX века — уже каждые 5 лет, и это, судя по всему, не предел. Приведем несколько примеров проявлений информационного взрыва. Число научных публикаций по большинству отраслей знания столь велико, а традиционный доступ к ним (чтение журналов) столь затруднен, что специалисты не могут успевать в них ориентироваться, что порождает дублирование работ и иные неприятные последствия. Часто оказывается проще заново сконструировать некоторое техническое устройство, чем найти документацию о нем в бесчисленных описаниях и патентах. Политический руководитель, принимающий на высоком уровне ответственное решение, но не владеющий полнотой информации, легко попадет впросак, а последствия могут быть катастрофическими. Разумеется, одной информации в таком деле мало, нужны и адекватные методы политического анализа, но без информации они бесполезны. В результате наступает информационный кризис, проявляющийся в следующем: • информационный поток превосходит ограниченные возможности человека по восприятию и переработке информации; • возникает большое количество избыточной информации (так называемый «информационный шум»), которая затрудняет восприятие полезной для потребителя информации; • укрепляются экономические, политические и другие барьеры, которые препятствуют распространению информации (например, по причине секретности). Частичный выход из информационного кризиса видится в применении новых информационных технологий. Внедрение современных средств и методов хранения, обработки и передачи информации многократно снижает барьер доступа к ней и скорость поиска. Разумеется, одни лишь технологии не могут решить проблему, имеющую и экономический характер (информация стоит денег), и юридический (информация имеет собственника), и ряд других. Эта проблема комплексная и решается усилиями как каждой страны, так и мирового сообщества в целом. Свобода доступа к информации и свобода ее распространения. Обсуждаемая проблема лежит больше в политической и экономической плоское- 224 Глава 7. Основы социальной информатики тях, нежели в технической, поскольку современные информационные технологии чисто технически открыли безграничный простор для информационных обменов. Без свободы доступа к информации информационное общество невозможно. Свобода доступа к информации и свобода ее распространения — обязательное условие демократического развития, способствующее экономическому росту, добросовестной конкуренции на рынке. Лишь опираясь на полную и достоверную информацию, можно принимать правильные и взвешенные решения в политике, экономике, науке, практической деятельности. Огромное значение имеет свобода распространения информации культурно-просветительного характера. Она способствует росту культурного и образовательного уровня общества. Вместе с тем, проблема свободы доступа к информации имеет и противоположную сторону. Далеко не всякая информация государственной, корпоративной или личной значимости должна свободно распространяться. Каждый человек имеет право на личные тайны; точно так же государство или корпорация может иметь секреты, жизненно важные для их существования. Не должно быть свободы для распространения информации, пропагандирующей насилие и иные, неприемлемые для общества и личности, явления. Поиск компромисса между свободой доступа к информации и неизбежными ограничениями является непростой задачей. Рост информационной культуры. Современное понимание информационной культуры заключается в умении и потребности человека работать с информацией средствами новых информационных технологий. Целенаправленные усилия общества и государства по развитию информационной культуры населения являются обязательными при продвижении по пути к информационному обществу. Одной из важных задач курса информатики является развитие элементов информационной культуры учгпцихся. Указанная задача носит комплексный характер, она не может быть решена только школой. Развитие элементов информационной культуры должно начинаться в детстве, в семье и проходить затем через всю сознательную жизнь человека, через всю систему образования и воспитания. Информационная культура включает в себя гораздо больше, чем простой набор навыков технической обработки информации с помощью компьютера и телекоммуникационных средств. Информационная культура должна стать частью общечеловеческой культуры. Культурный (в широком смысле) человек должен уметь оценивать получаемую информацию качественно, понимать ее полезность, достоверность и т. д. Существенный элемент информационной культуры — владение методикой коллективного принятия решений. Умение взаимодействовать в информационном поле с другими людьми — важный признак человека информационного общества. Изменения в сфере образования. По мере продвижения к информационному обществу большие изменения происходят в сфере образования. Одна из принципиальных проблем, стоящих перед современным образованием, — сделать его более доступным для каждого человека. Эта доступность имеет и экономические, и социальные, и технологические аспекты. § 41. Информационное общество 225 В силу своего динамизма информационное общество потребует от своих членов непрерывного, на протяжении десятков лет, обучения. Это позволит человеку не отставать от времени, быть способным сменить профессию, занять достойное место в социальной структуре общества. Экономически развитые страны уже сегодня встали на путь создания системы непрерывного образования, включающей дошкольное и школьное образование, профессиональное образование, систему профессиональной переподготовки и повышения квалификации, дополнительного образования и т. д. Уровень количественного и качественного развития образовательной системы позволяет судить о степени продвижения страны по пути к информационному обществу. Изменение уклада жизни людей. Формирование информационного общества существенно отражается на повседневной жизни людей. По уже имеющимся примерам можно предвидеть, что изменения будут глубокими. Так, массовое внедрение телевидения в 60-70-х годах XX века существенно изменило быт людей, причем не только в лучшую сторону. С одной стороны, у миллионов людей появилась возможность доступа к сокровищам национальной и мировой культуры, с другой — сократилось живое общение, стало больше стереотипов, насаждаемых телевидением, сузился круг чтения. Рассмотрим отдельные составляющие уклада жизни, анализируя то, что уже состоялось, и то, что нарождается в наше время. Работа. По данным социологического исследования, проведенного в США, уже сейчас до 10% работающих могут трудиться, не выходя из дома, а 1/3 всех недавно зарегистрированных фирм основана на широком использовании самостоятельной занятости, не связанной с регулярным приходом в офис. Досуговая деятельность меняется на наших глазах. Компьютерные игры, уже занимающие у части людей заметное время, трансформируются в сетевые игры с участием нескольких удаленных партнеров. Растет время, затрачиваемое на «хождение » по Интернету без определенной цели, на «чат», зачастую с не очень осмысленным обменом сообщениями. Вместе с тем реализуются и __^ ^___ познавательные путешествия по об-разовательным сайтам, виртугшьным музеям и т. д. Как уже говорилось выше, информационная культура — лишь часть культуры общечеловеческой, и форма проведения досуга определяется, в первую очередь, общей культурой конкретного человека. Недавнее достижение интернет-технологий — «поход за покупками» реальных товаров в виртуальный интернет-магазин — уже начинает заметно сказываться на системе торговли. Т ЭРМИТАЖ 226 Глава 7. Основы социальной информатики ,и.€и^ГО \ сэкономь 20% a# « J JSFwwo 4<*»*е*6 I'* Жилище человека имеет тенденцию к все большей «информатизации». Уже сдаются в эксплуатацию дома, в которые вместо жгута проводов (электропроводка, телефон, телевидение, охранная и пожарная сигнализации ИТ. д.) входит лишь один силовой кабель и один информационный кабель. Последний берет на себя все информационные связи, включая обеспечение многих каналов кабельного телевидения, выход в Интернет и т. д. Специальный электронный блок в такой квартире будет контролировать все устройства, включая бытовую технику и системы жизнеобеспечения, помогать обитателю квартиры жить максимально комфортно. Подобное здание называют шумным домом^. Поскольку для многих людей автомобиль стал продолжением среды обитания, появление «умных автомобилей» также важно. Такой автомобиль кроме уже ставших обязательными микропроцессорных устройств, обслуживаюш;их его техническую часть, постоянно связан с городскими информационными службами, подсказывающими наиболее оптимальный на настоящий момент маршрут (с учетом занятости трасс). Кроме того, этот автомобиль связан с «умным домом» своего хозяина, и из него можно этим домом управлять. Опасности информационного общества. Восхищаясь возможностями, которые несет информационное общество, не следует забывать о тех противоречиях, которые оно потенциально содержит и которые уже, по мере продвижения к нему, проявляются. Следует понимать, что понятие «информационное общество» не лежит в том же круге понятий, которые связаны с понятиями «капитализм», «социализм» и пр., т. е. не указывает напрямую на характер отношений собственности и экономический уклад. Точно так же его не следует воспринимать как очередную утопию, сулящую всеобщее счастье. Перечислим некоторые опасности и проблемы на пути к информационному обществу: • реальная возможность разрушения посредством информационных технологий частной жизни людей и организаций; § 41. Информационное общество 227 опасность все большего влияния на общество средств массовой информации и тех, кто эти средства контролирует; проблема отбора качественной и достоверной информации при большом ее объеме; проблема адаптации многих людей к среде информационного общества, к необходимости постоянно повышать свой профессиональный уровень; столкновение с виртуальной реальностью, в которой трудноразличимы иллюзия и действительность, создает у некоторых людей, особенно молодых, малоизученные, но явно неблагоприятные психологические проблемы; переход к информационному обществу не сулит каких-либо перемен в социальных благах и сохраняет социальное расслоение людей; более того, к существующим видам неравенства может добавиться информационное неравенство, усилив тем самым социальную напряженность; сокращение числа рабочих мест в экономике развитых стран, не компенсируемое полностью созданием новых рабочих мест в информационной сфере, ведет к опасному социальному недугу — массовой безработице. Подведем итоги 1. Человечество прошло через четыре информационные революции. 2. Четвертая информационная революция связана с появлением и развитием микропроцессорной техники и компьютерных телекоммуникаций. 3. В настоящее время в цивилизованном мире происходит процесс движения к информационному обществу. 4. Формирование информационного общества изменяет структуру экономики государств и структуру рынка труда. 5. Информационный кризис общества связан с тем обстоятельством, что обрушившийся на человека поток информации оказывается недоступным обработке в приемлемое время. 6. Новые информационные технологии помогают разрешить информационный кризис. Однако в полной мере это возможно в комплексе с другими мерами: экономическими, юридическими и пр. 7. В России имеется ряд объективных предпосылок к переходу к информационному обществу. Среди них: быстрое развитие материальной базы информационной сферы, информатизация многих отраслей производства и управления, активное вхождение в мировое сообщество, подготовленность общественного сознания и др. 8. Движение России к информационному обществу реализуется государством как стратегическая, приоритетная цель, достижению ко- 228 Глава 7. Основы социальной информатики торой способствует достаточно высокий кадровый и научно-технический потенциал страны. 9. Среди приоритетных задач процесса движения к информационному обществу находятся: информатизация всей системы образования; развитие индустрии информационных услуг; следование национальным культурно-историческим традициям. 10. Информационная культура в современном понимании заключается в умении и потребности человека работать с информацией средствами новых информационных технологий. 11. Основы информационной культуры человека должны закладываться в детстве. 12. Задача информационного общества в сфере образования — сделать образование доступным для каждого человека, преодолеть неравенство в этой области. 13. Формирование информационного общества приводит к изменениям во всех составляющих уклада жизни людей: в работе, в учебе, в быту и отдыхе и т. д. 14. Информационное общество не свободно от ряда опасностей и проблем. Вопросы и задания 1. Какие события и процессы определили четыре информационные революции? 2. Что такое информационное общество? 3. Сформулируйте критерий, определяющий стадии информационного общества. 4. К каким изменениям в экономике государства и на рынке труда приводит формирование информационного общества? 5. Каково настоящее состояние и перспективы информационных и коммуникационных технологий? 6. В чем заключается информационный кризис общества? Каковы пути его преодоления? 7. Определите связь между понятиями «информационное общество» и «свобода доступа к информации». 8. Что такое информационная культура? 9. Как соотносится информационная культура с общечеловеческой культурой? 10. Какие проблемы образования будут решены в информационном обществе? 11. Определите изменения, которые произойдут в укладе жизни членов информационного общества: в работе, в учебе, в быту. 12. Какие наиболее существенные проблемы и опасности существуют на пути к информационному обществу? 13. Почему задача движения к информационному обществу для России относится к числу приоритетных? 14. Приведите известные вам примеры, отражающие наличие процесса движения России к информационному обществу. § 42. Правовое регулирование в информационной сфере 229 Правовое регулирование в информационной сфере у... Уже на раннем этапе продвижения к информационному обществу необходимы меры правового регулирования вновь возникающих отношений. Каждая страна идет в этом направлении своим путем. Юридические вопросы, возникающие в информационной сфере, на сегодняшний день столь сложны и запутанны, что гармоничного законодательства, решающего все соответствующие проблемы, нет ни в одной стране мира. Коротко опишем некоторые законы, действующие в этой сфере в Российской Федерации. Закон РФ № 3523-1 «О правовой охране программ для ЭВМ и баз данных» дает юридически точное определение понятий, связанных с авторством и распространением компьютерных программ и баз данных. Он определяет, что авторское право распространяется на указанные объекты, являющиеся результатом творческой деятельности автора. Автор (или авторы) имеет исключительное право на выпуск в свет программ и баз данных, их распространение, модификацию и иное использование. Однако имущественные права на указанные объекты, созданные в порядке выполнения служебных обязанностей или по заданию работодателя, принадлежат работодателю. Имущественные права, в отличие от авторских, могут быть переданы иному физическому или юридическому лицу на договорной основе. Для современного состояния нашего общества именно вопросы, связанные с нарушением авторских и имущественных прав, являются наиболее актуальными. Значительная часть программного обеспечения, использующегося частными лицами и даже организациями, получена путем незаконного копирования. Эта практика мешает становлению цивилизованного рынка компьютерных программных средств и информационных ресурсов. Данный вопрос стал для нашей страны особенно актуальным в процессе вступления России в международные организации и союзы — например, во Всемирную торговую организацию. Несоблюдение прав в сфере собственности на компьютерное программное обеспечение стало объектом уголовного преследования на практике. Закон РФ №149-ФЗ «Об информации, информационных технологиях и защите информации» регулирует отношения, возникающие при: 230 Глава 7. Основы социальной информатики осуществлении права на поиск, получение, передачу и производство информации; применении информационных технологий; обеспечении защиты информации. В частности, в статье 8 «Право на доступ к информации» утверждается право гражданина на получение из официальных источников информации о деятельности государственных органов, об использовании бюджетных средств, о состоянии окружающей среды, и пр., а также любой информации, непосредственно затрагивающей его права и свободы. Ограничение доступа к информации устанавливается только федеральными законами, направленными на обеспечение государственной безопасности. В статье 12 «Государственное регулирование в сфере применения информационных технологий», в частности, отмечается, что обязанностью государства является создание условий для эффективного использования в Российский Федерации информационно-телекоммуникационных сетей, в том числе Интернета. Особое внимание обратим на статью 3, в которой среди принципов правового регулирования в информационной сфере провозглашается принцип неприкосновенности частной жизни, недопустимость сбора, хранения использования и распространения информации о частной жизни лица без его согласия. В 2006 году вступил в силу закон №152-0ФЗ «О персональных данных», целью которого является обеспечение защиты прав и свобод человека и гражданина при обработке его персональных данных (с использованием средств автоматизации или без использования таких), в том числе защиты прав на неприкосновенность частной жизни, личную и семейную тайну. В 1996 году в Уголовный кодекс был впервые внесен раздел «Преступления в сфере компьютерной информации». Он определил меру наказания за некоторые виды преступлений, ставших, к сожалению, распространенными: • неправомерный доступ к компьютерной информации; • создание, использование и распространение вредоносных программ для ЭВМ; • умышленное нарушение правил эксплуатации ЭВМ и их сетей. Отметим, что правовое регулирование в информационной сфере, в силу ее быстрого развития, всегда будет отставать от жизни. Как известно, наиболее счастливо живет не то общество, в котором все действия людей регламентированы, а наказания за все дурные поступки прописаны, а то, которое руководствуется, в первую очередь, соображениями этического порядка. Это значит в данном случае, что государство не злоупотребит информацией, доверенной ему гражданином, потому что оно устроено должным образом; что информация не крадется не потому, что за это предусмотрено наказание, а потому, что человек считает воровство, в любом его проявлении, низким поступком, порочащим его самого. Именно к таким отношения между государством и личностью, а также между отдельными членами общества мы должны стремиться. § 43. Проблема информационной безопасности 231 Подведем итоги 1. Правовое регулирование в информационной сфере является новой и сложной задачей для государства. В Российской Федерации существует ряд законов в этой области. 2. Закон «О правовой охране программ для ЭВМ и баз данных» дает юридически точное определение понятий, связанных с авторством и распространением компьютерных программ и баз данных. 3. Закон РФ №149-ФЗ «Об информации, информационных технологиях и защите информации» регулирует отношения, возникающие при: осуществлении права на поиск, получение, передачу и производство информации; применении информационных технологий; обеспечении защиты информации. В статье 12 «Государственное регулирование в сфере применения информационных технологий», в частности, отмечается, что обязанностью государства является создание условий для эффективного использования в Российский Федерации информационно-телекоммуникационных сетей, в том числе Интернета. 4. В Уголовном кодексе РФ имеется раздел «Преступления в сфере компьютерной информации». Он предусматривает наказания за; • неправомерный доступ к компьютерной информации; • создание, использование и распространение вредоносных программ для ЭВМ; • умышленное нарушение правил эксплуатации ЭВМ и их сетей. Вопросы и задания 1. Зачем нужны законодательные акты в информационной сфере? 2. Какой закон регламентирует права авторов программ и баз данных? 3. Какой закон регламентирует вопросы защиты информационных ресурсов? 4. На какой закон вы сошлетесь, если вам будет нанесен ущерб путем использования информации, касающейся вашей частной жизни? 5. Какие действия Уголовный кодекс классифицирует как преступления в компьютерной информационной сфере? Проблема информационной безопасности По мере продвижения к информационному обществу все более острой становится проблема защиты права личности, общества и государства на конфиденциальность (т. е. секретность) определенных видов информации. Уже сегодня в странах, в которых в массовом порядке используются компьютерные сети, предпринимаются огромные усилия по охране ин- 232 Глава 7. Основы социальной информатики формации. Каждый человек, доверяющий информацию о себе государственному органу или фирме, вправе рассчитывать на то, что она не будет разглашена или использована ему во вред. В России в 2000 году принята Доктрина информационной безопасности Российской Федерации. Рассмотрим основные ее положения. К объектам информационной безопасности РФ относятся: • все виды информационных ресурсов; • права граждан, юридических лиц и государства на получение, распространение и использование информации, защиту информации и интеллектуальной собственности; • система формирования, распространения и использования информационных ресурсов, включающая в себя информационные системы различного класса и назначения, библиотеки, архивы, базы и банки данных, информационные технологии и т. д.; • информационная инфраструктура, включающая центры обработки и анализа информации, каналы информационного обмена и телекоммуникации, механизмы обеспечения функционирования телекоммуникационных систем и сетей; • система формирования общественного сознания (мировоззрение, моральные ценности, нравственные оценки, социально допустимые стереотипы поведения и взаимоотношения между людьми), базирующаяся на средствах массовой информации и пропаганды. Национальные интересы РФ включают: а) соблюдение конституционных прав и свобод человека и гражданина в области получения информации и ее использования, обеспечение духовного становления России, сохранение и укрепление ценностей общества; б) информационное обеспечение государственной политики РФ, связанное с доведением до российской и международной общественности достоверной информации о государственной политике РФ; в) развитие современных информационных технологий отечественной индустрии информации; г) защиту информационных ресурсов от несанкционированного доступа, обеспечение безопасности информационных и телекоммуникационных систем. В доктрине формулируются методы обеспечения информационной безопасности страны (включая правовые, организационно-технические и экономические методы), а также особенности обеспечения информационной безопасности РФ в различных сферах общественной жизни: экономической, политической, в сфере обороны, науки и техники и др. Одной из важнейших проблем в обсуждаемой сфере доктрина объявляет проблему информационного неравенства, которое вносит раскол в общество и отчуждение между составляющими его группами населения; поэтому данная проблема имеет прямое отношение к национальной безо- § 43. Проблема информационной безопасности 233 пасности. Особенно важно преодоление проявлений информационного неравенства в образовании, поскольку: • появилась тенденция разделения образовательных учреждений на элитные и массовые с соответствующей разницей в ресурсном обеспечении; • велико различие уровней доходов семей учащихся; • значителен разрыв в размерах финансового обеспечения образовательных учреждений в различных регионах страны. Преодоление информационного неравенства является задачей первостепенной государственной важности. Подведем итоги 1. Наиболее острой проблемой информационного общества является проблема информационной безопасности, от отдельного человека до государства. 2. Проблемы информационной безопасности в России регламентируются Доктриной информационной безопасности РФ. 3. В Доктрине информационной безопасности определен перечень информационных объектов, требующих защиты; национальные интересы РФ в информационной сфере; методы обеспечения информационной безопасности. 4. Доктрина информационной безопасности обращает особое внимание на проблему информационного неравенства в области образования. Вопросы и задания 1. Какую информацию вы считаете конфиденциальной для государства, для вашей школы, для себя лично? 2. Что относится к объектам информационной безопасности России? 3. Что относится к национальным интересам России в информационной области? 4. Как проявляется информационное неравенство в системе образования? 5. Сталкивались ли вы в своей жизни с проявлениями информационного неравенства? Краткие биографические справки Сэмюэль Морзе (1791—1872) Сэмюэль Морзе родился в семье проповедника в маленьком американском городе Чарльзтаун. С детских лет его любимым увлечением было рисование. В 1805 г. он поступил в Йельский университет. Мы ничего не знаем, сколь прилежным он был студентом. Одно лишь заслуживает внимания. Морзе прослушал в университете курс лекций по электричеству. Исследования электрических явлений в то время были злобой дня. Вероятно, эта область физики не оставила Сэмюэля безучастным. Однако он всецело был предан занятиям рисованием и в 1811 г. отправился в Европу, чтобы там совершенствовать свое мастерство. Два года спустя в Лондонской королевской академии художеств была выставлена его картина «Умираюш;ий Геркулес», удостоенная золотой медали. Но по каким-то причинам в 1815 г. Морзе расстается со Старым Светом и отправляется на родину. Однако прошло несколько лет, прежде чем он стал признанным лидером американских художников. В 1825 г. Морзе основал в Нью-Йорке Общество живописи (впоследствии — Национальная академия). В 1826 г. он снова отправляется в Европу. Ему пришла в голову мысль написать картину, которая позволила бы американцам узнать о шедеврах мировой живописи. Так появилась на свет его наиболее известная картина «галерея Лувра». На ее заднем плане в миниатюре изображено столько шедевров, сколько могло вместить полотно. В 1832 г. Морзе окончательно возвращается в Америку и получает место профессора рисунка и живописи Нью-Йоркского университета. 1832 год стал для Сэмюэля Морзе едва ли не самым значительным в его жизни. По пути на родину на борту судна возник разговор об опытах английского ученого Майкла Фарадея по электромагнетизму — «извлечению искр из магнита». В памяти Морзе возникли те сведения по электричеству, которые он получил некогда в Йельском университете. «А нельзя ли создать систему передачи сигналов по проводам, используя сочетания последовательностей передачи искр? » — Такая необычайная мысль пришла в голову живописцу Сэмюэлю Морзе. Художник становится инженером. Три года он конструирует невиданный ранее аппарат и демонстрирует свое творение в сентябре 1832 г. в Нью-Йоркском университете живописи. В качестве языка для передачи Морзе разработал специальный код, который во всем мире стал именоваться азбукой Морзе. * Материал этого раздела подготовлен Д. Николаевым. Краткие биографические справки 235 Жан Бодо (1845-1903) Он принадлежал к той категории постоянно думающих людей, привычных к радостям и к огорчениям, которых принято называть изобретателями. Таковым был француз Жан Морис Эмиль Бодо. Ему не присуждали престижных наград, не избирали членом многочисленных ученых обществ. Но благодаря его изобретению телеграфия сделала огромный шаг вперед, заметно заглянув в будущее. Жану Бодо было всего 28 лет, когда (в 1872 г.) он сконструировал телеграфный аппарат многократного действия. Другое выдающееся достижение Бодо заключалось в изобретении принципиально нового телеграфного кода. Если код Морзе являлся по-существу троичным (точка, тире, пауза) и неравномерным, то код Бодо был равномерным пятибитовым. Каждая пятерка сигналов соответствовала знаку текста. Код Бодо стал первым способом двоичного кодирования информации. Он был воспринят повсеместно и стал называться Международным Телеграфным Кодом № 1 (ITA1). Впоследствии на основе аппарата Бодо появились конструкции телетайпов. Единица скорости передачи информации получила название бод. Карл Линней (1707—1778) Заведующий ботаническим садом голландского города Хартскамп Карл Линней в 1735 г. защищал диссертацию на степень доктора медицины «Новая гипотеза перемежающихся лихорадок». В этом не было ничего удивительного, поскольку многие выдающиеся естествоиспытатели того времени приходили в большую науку именно через врачебную практику. Линней родился 23 мая 1707 г. в шведском городе Росхульт, в семье деревенского пастора. В гимназии он не блистал, особенно не любил латинский язык, и учителя не сулили ему радужных перспектив. Тем не менее Карл в конце 1720-х гг. сумел получить хорошее образование в Лундском и Упсальском университетах. Именно там у него определился интерес к ботанике. В 1732 г. он совершил путешествие по Лапландии (большая область на севере Скандинавии). Свои наблюдения и собранную им коллекцию растений он описал в книге «Флора Лапландии» (полное издание — 1737 г.). Но в тот год, когда Линней защищал диссертацию, уже увидел свет его главный труд «Система природы», при жизни автора выдержавший 12 изданий. Он принес Линнею мировую известность. Линней стал национальной гордостью Швеции. Уже в 1733 г. его избрали первым президентом Шведской академии наук. Им была создана система растительного и животного мира. Эта система органического мира имела такую же важность, как впоследствии Периодическая система элементов неорганического мира Д. И. Менделеева. В чем же заключалась система Линнея? Необходима была кгпсая-то единица систематизации. В качестве таковой, единой для всего живого, Линней выбрал вид. Под этим термином он понимал похожие особи, составляющие множество и образующие потомство. Линней был против идеи изменяемости видов: «...видов насчитывается столько, сколько их было создано в самом начале», но к концу жизни он отошел от этой точки зрения. 236 Краткие биографические справки А затем пришла на помош;ь пресловутая латынь, с которой Линней враждовал в гимназические годы. Но выбора не было: в те времена латынь являлась международным научным языком. Пользуясь латинскими названиями системных единиц растительного и животного мира, Линней сделал свою «Систему природы» общедоступной. Линней предложил так называемую бинарную номенклатуру: каждый вид обозначался двумя латинскими названиями — родовым и видовым. Он разработал также иерархию систематических групп: сходные виды объединил в роды; сходные роды — в семейства; семейства — в отряды; отряды — в классы и, наконец, классы — в типы. Он разделил животных на шесть классов (млекопитающие, птицы, земноводные, насекомые и черви). Для характеристики человека он впервые ввел термин «homo sapiens» («человек разумный»). Более сложной была линнеевская систематика растений. При этом опыт, накопленный им при ознакомлении с растениями из различных местностей, привел его к пересмотру идеи неизменяемости. «Систематизатор» Линней классифицировал также почвы и минералы, болезни (по симптомам), ядовитые и целебные свойства растений. Здесь он отдал дань своим медицинским познаниям. Спустя 10 лет после смерти ученого в Лондоне было учреждено « Линне-евское общество». Оно и поныне существует как один из крупных научных центров. Владимир Иванович Вернадский (1863—1945) Он относился к числу величайших естествоиспытателей-мыслителей, будучи философом в естествознании и естествоиспытателем в философии. Как и его выдающиеся соотечественники — Михаил Васильевич Ломоносов в XVIII веке, Дмитрий Иванович Менделеев в XIX веке. Владимир Иванович Вернадский получил всемирное признание как один из основателей геохимии: «Геохимия научно изучает химические элементы, т. е. атомы земной коры и — насколько возможно — всей планеты. Она изучает их историю, их распределение и движение в простргшстве и времени, их генетические на нашей планете соотношения». Иными словами, он первым привел в систему накопленные сведения и понятия о геохимии, тем самым дав богатейшую информацию для последующих исследований и размышлений. В конце девятнадцатого столетия австрийский геолог Эдуард Зюсс ввел понятие земных оболочек (сфер) Земли: атмосферы, гидросферы, литосферы и стратосферы. Кроме того, он добавил к ним еще и биосферу — ту зону на поверхности Земли, где распространена органическая жизнь. Проблемы биосферы глубоко захватили Вернадского и стали одним из главных интересов его жизни. Он оценивал биосферу гораздо глубже, чем Зюсс: «Сплошной покров из живого вещества, в котором сконцентрирована огромная химическая энергия, являющаяся порождением солнечной». Живое вещество он рассматривал как совокупность живых организмов, как необходимую часть и одновременно функцию биосферы. Краткие биографические справки 237 Ученый считал биосферу строго организованной оболочкой земной коры, неразрывно связанной с жизнью. Этой своей организованностью она и отличается от других земных сфер. Вернадский провел оценку размеров биосферы, связав их с пределами возможности существования живого вещества. По его расчетам, верхняя граница биосферы лежит в области 140-180 °С — она еще доступна для обитания отдельных живых организмов. При низких температурах организмы более выносливы: так споры некоторых плесневых грибков сохраняют жизнеспособность вплоть до -250 °С. Пределы же существования зеленой растительности несравненно более ограничены: от -1-80 °С до -60 °С. Вернадский подошел к биосфере с позиции геохимии: «Раньше организмы влияли на историю только тех атомов, которые были нужны им для их роста, размножения, питания, дыхания. Человек расширил этот круг, влияя на элементы, нужные для техники и создания цивилизованных форм жизни». Так родилась новая наука — биогеохимия. В конце 1944 г. он публикует одну из самых своих глубоких работ «Несколько слов о ноосфере»: «Лик планеты — биосфера — резко меняется человеком сознательно и, главным образом, бессознательно. Меняется физически и химически воздушная оболочка суши, все ее природные воды... Человечество, взятое в целом, становится мощной геологической силой. И перед ним... становится вопрос о перестройке биосферы в интересах мыслящего человека как единого целого. Это новое состояние биосферы, к которому мы, не замечая того, приближаемся, и называется ноосферой. ...Я смотрю на всё с точки зрения ноосферы и думаю, что в буре, грозе и страданиях родится новое, прекрасное будущее человечества». Норберт Винер (1894-1964) До конца 1940-х гг. американский математик Норберт Винер не числился среди математиков первого ранга, хотя достиг уже достаточно почтенного возраста (он родился 26 ноября 1894г.). Однако он был исключительно способным человеком. В самом деле: в 11 лет окончил среднюю школу, в 14 — высшее учебное заведение (при этом получив звание бакалавра), в 17 лет стал магистром искусств. Наконец, когда ему исполнилось 18, он получил степень доктора философии за работы в области математической логики. Это феерическое восхождение завершилось стажировкой в Кембриджском и Гёттингенском университетах. Свое первое научное открытие, сразу привлекшее к нему внимание, Винер сделал в 1920-х гг. Суть его нелегко изложить неспециалисту. В двух словах: ученый определил так называемый винеровский процесс. Он относится к броуновскому движению (хаотичному перемещению частиц в капле жидкости). Кроме того, ученый выполнил несколько оригинальных работ, посвященных развитию гармонического анализа. Мировая война потребовала згшяться прикладными проблемами, свя-згшными с авиацией и артиллерией. Тем не менее в эти годы произошло событие, которое лишь спустя много лет историки стали рассматривать как исходную точку будущих великих событий. Винер организовал в Принсто- 238 Краткие биографические справки не математический семинар необычного профиля: в нем приняли участие нейрофизиологи, специалисты по теории связи и вычислительной техники. Этот семинар впоследствии станут считать началом нового научного направления — кибернетики. Вот каким образом термин «кибернетика» начал обретать плоть и кровь. В 1946 г. в Париже на конференции по математике Винеру предложили написать книгу, в которой освещались бы возможности обратной связи между машиной и нервной системой человека. Ученый охотно дал согласие, ибо над данной проблемой он размышлял уже немало времени. Трудность состояла не в последовательности изложения материала — в выборе подходящего названия для книги. И он выбрал: «Кибернетика». Правда, историки утверждают, что это название родилось много веков тому назад и придумал его древнегреческий мыслитель Платон. В XIX веке французский физик А. Ампер предложил так назвать науку об управлении человеческим обществом. Плохо вычитанная, неряшливо оформленная, в обложке неприятного ядовито-желтого цвета книга, казалось, не может иметь коммерческого успеха. Стала же она, как принято говорить теперь, бестселлером, а слово «кибернетика» моментально вошло во многие словари и энциклопедии. Норберт Винер стал «крестным отцом» новой науки, которой предстояло перевернуть мир. Она в конечном счете является одним из краеугольных камней информатики. Клод Шеннон (1916-2001) В томе 27 за 1948 г. журнала «Bell System Technical Journal», в июльском и октябрьском номерах публикуется работа американского инженера Клода Шеннона «Математическая теория связи». Она занимала всего 77 страниц и поначалу не воспринималась должным образом. Только со временем ее назовут эпохальной, ибо статья по существу сигнализирует о появлении новой научной дисциплины: теории информации. Шеннон предлагает и соответствующий понятийный аппарат: количество информации на основе понятия энтропии; канал связи и его пропускная способность; пределы передачи информации. Редкий пример, когда дата появления новой научной дисциплины может быть названа столь определенно. Строго говоря, Шеннон был в большей степени инженером, нежели математиком, а его работы имели скорее физическое, чем математическое обоснование. Однако видный отечественный ученый А. Н. Колмогоров отмечал, что, хотя «строгое математическое «обоснование» своих идей Шеннон... предоставил своим продолжателям, его математическая интуиция изумительно точна». Конечно, возникновение теории информации не стало для Шеннона внезапным озарением. В 1940 г. он защитил магистерскую диссертацию на тему «Символьный анализ релейных и переключательных схем» (впоследствии ее назовут самой выдающейся магистерской диссертацией XX века). И «не переводя дыхания» в том же году получает диплом доктора философии по математике за работу «Алгебра теоретической генети- Краткие биографические справки 239 ки». Но она прошла незамеченной и была опубликована только в конце прошлого века (хотя в ней и содержалось немало значительных выводов). Шеннон одним из первых сформулировал теоретические основы криптографии. В частности, исследовал проблемы абсолютной секретности систем и обсуждал принципы, которым должны отвечать надежные шифры. Про него говорили впоследствии, что он превратил искусство криптографии в науку. Шеннон интересовался возможностью создания «шахматной машины», точнее говоря, разработкой программы для нее. Здесь он достиг определенных успехов и, посетив Москву в 1960-х гг., даже намеревался сыграть партию с чемпионом мира по шахматам М. М. Ботвинником. Еш;е не достигнув 60 лет, Шеннон фактически прекратил научно-техническую деятельность; теорию информации интенсивно и успешно развивали его последователи. Сам же патриарх занимался всякого рода развлекательными проблемами. Например, создал «общую теорию жонглирования», построив несколько жонглирующих машин. Владимир Александрович Котельников (1908—2005) «Ничего важнее радио в технике за последние 100 лет не возникло... Оно повлияло на жизнь значительно сильнее, чем авиация. С радио начались электроника, телевидение, вся информатика и компьютеры», — так ответил Владимир Александрович Котельников на вопрос интервьюера. Быть может, кто-нибудь и усмотрит в этих словах некоторое преувеличение. Однако судите сами. Вот краткий перечень дисциплин, которые ныне находятся на переднем крае науки; радиофизика, радиотехника, радиоастрономия, электроника, информатика. И в каждую из них Котельников внес фундаментальный вклад. Ему были вручены высшие награды, присуждаемые за работы в этих дисциплинах. С его именем связано важнейшее направление во всех науках, так или иначе имеющих отношение к информатике, — цифровая обработка сигналов. Разработанная ученым теория потенциальной помехоустойчивости позволяет определить качество любых каналов связи. Котельников был одним из пионеров нового направления в освоении космоса — планетной радиолокации. Разносторонность интересов Владимира Александровича и важность достигнутых результатов позволяют считать его,одним из основоположников теории информации. Его «альма матер» был Московский энергетический институт, который он закончил в 1931 г. Работа «Теория потенциальной помехоустойчивости», опубликованная в 1947 г., принесла ему мировую известность. В 1953 г. он был избран действительным членом Академии наук СССР. В течение нескольких лет был вице-президентом академии. Котельников прожил очень долгую жизнь, всего лишь трех лет ему не хватило до столетия. Он обладал выдающимися личными качествами. Его отличала необычайная серьезность в подходе к решению любой проблемы, неизменная доброжелательность, обязательность в выполнении обещанного. Фактически до конца дней он продолжал работать в меру своих сил и возможностей. 240 Краткие биографические справки Академии многих стран избирали его своим иностранным членом. По решению Международного астрономического союза астероид 2726 носит имя ученого: Kotelnikov. Аль-Хорезми Уже в наши дни один видный историк науки назвал Аль-Хорезми «величайшим математиком своего времени и, если принять во внимание все обстоятельства, одним из величайших всех времен >>. Его полное имя Мухаммед ибн Муса аль-Хорезми, Биографические сведения о нем весьма скудны. Более или менее достоверно известно следующее. Он родился в конце VIII века (иногда приводят «точную дату» 783 г.) в Хиве, располагавшейся в обширной области Средней Азии — Хорезме: отсюда и «фамилия» узбекского ученого. Скончался в середине IX века (предположительно 850 г.) в Багдаде. Где набирался знаний Аль-Хорезми? В Багдаде, столице Арабского халифата, существовал «дом мудрости», своего рода академия наук. Ученые многих арабских стран почитали за счастье оказаться в ее стенах. Аль-Хорезми написал немало книг. Из них до нас дошло семь — в виде оригинальных текстов, текстов его комментаторов либо в переводах на латынь. Около 830 г. он написал свой классический трактат «Краткая книга восполнения и противостояния». По-арабски название звучало так: «Китаб аль-джебр-валь-мукабала». Здесь слово «аль-джебр» (восполнение) в современном понимании означало перенесение отрицательного члена из одной части уравнения в другую. Из этого слова и возникло название «алгебра». Упомянутая книга начиналась с введения и описания натуральных чисел, затем рассматривались уравнения первой и второй степени. Аль-Хорезми нигде не пользовался символами, а все математические вычисления описывал с помощью слов. В трактате ученого впервые появились общие правила решения квадратных уравнений. Это были лишь первые ростки того раздела математики, который является обширной частью ее истории и основой многих постоянно возникавших математических направлений. Другое сочинение Аль-Хорезми посвящалось арифметике. Оно сыграло важнейшую роль в истории математики. В нем были впервые изложены основы и правила арифметики, основанные на десятичной системе счисления. Это сочинение перевели на латинский язык. По-латыни имя Аль-Хорезми звучало как Algorizmi или Algorismus. Широкая популярность сочинения в Европе привела к тому, что имя автора стало нарицательным, и европейские математики в средние века так именовали арифметику, основанную на десятичной системе счисления. С течением времени подобный термин стали употреблять для любой системы вычислений согласно определенным правилам. Вот как появился термин «алгоритм ». Аль-Хорезми внес заметный вклад в астрономию, в частности упорядочил способы датировки различных событий. Он оказался близок к проблемам географии, был автором первого сочинения по математической географии. Он организовывал научные экспедиции в Византию, Хазарию, Афганистан. Впервые на арабском языке описал известную в те времена Краткие биографические справки 241 обитаемую часть Земли. «Книга картины Земли» — так называлось это его сочинение. Наконец, он участвовал в вычислении длины одного градуса земного меридиана. Словом, великий математик Аль-Хорезми был и великим ученым-эн-циклопедистом. Алан Тьюринг (1912-1954) Он появился на свет 23 июня 1912 г. в небогатой английской аристократической семье. В 1926 г. родители зачислили его в престижную Шер-борнскую публичную школу — закрытое учебное заведение для мальчиков из семей аристократов. Алан отнюдь не стал украшением школы. Напротив, преподаватели испытывали в нем глубокое разочарование, и, как правило, в классном журнале появлялись весьма негативные оценки о его прилежании. Словом, Алан числился в вечных аутсайдерах. Лишь единственная запись о нем в кондуите выглядит диссонансом: «Если он хочет быть только научным специалистом, то лишь теряет время в этой школе. Наверное, он будет математиком. Такие ученики, как он, рождаются один раз в 200 лет». Мы не знаем автора этого заключения. Как знать, может, то был образчик пресловутого английского юмора? Но ведь «инкогнито» оказался прав... Бесспорно то, что Алан Тьюринг получил математическое образование случайно. Выглядит неправдоподобно, но в 15 лет юноша самостоятельно освоил теорию относительности. В 1931 г. Алан стал студентом Королевского колледжа Кембриджского университета. Пасынок Шернборнской школы, в престижнейшем Кембридже Тьюринг проявил свои истинные способности во всем блеске. В 1934 г. он получает степень бакалавра, спустя год — степень магистра и аспирантскую стипендию. Все ярче восходит его звезда. В 1936 г. он уже в Принстоне (США), где работает вместе с Джоном фон Нейманом. Алан получил нетривиальные результаты в области алгебры и теории чисел и развил оригинальные идеи в области логики вычислений. Этот предмет составил тему его докторской диссертации — она оказалась самой сложной и глубокой его математической работой. В годы Второй мировой войны он переключился на конструирование щифровальных машин. Созданный им «Колосс» оказался в то время рекордом криптографии. По окончании войны Тьюрингом всецело овладевает идея разработки универсального электронного компьютера, для которого можно было бы разрабатывать программы и который мог бы решать множество задач: проводить сложнейшие алгебраические вычисления, раскрывать шифры и даже... играть в шахматы. Собрание библиотеки программ, создание единого национального компьютерного центра - об этом мечтал Тьюринг. В 1949 г. в Манчестерском университете (Англия), где в это время работал ученый, под его руководством был сконструирован компьютер Manchester Mark I. Его усовершенствование привело к появлению одного из первых в мире компьютеров Ferranti Mark I. 242 Краткие биографические справки Свои достижения Тьюринг подытожил в 1952 г. в обширной статье «Вычислительные машины и интеллект» (в 1960-е гг. она вышла в русском переводе под названием «Может ли машина мыслить?»). «...Алан Тьюринг представляется нам как основатель компьютерной науки, доминирующей технологии XX века», — скажет впоследствии его биограф. Эмиль Пост (1897—1954) В детстве Эмиль Леон Пост очень хотел стать астрономом. Он родился в польском местечке Августов. На рубеже веков его родители эмигрировали за океан и обосновались в Нью-Йорке. В школе Эмиля постигло несчастье: он лишился левой руки. Можно ли с таким дефектом заниматься астрономией? Сотрудник Главной обсерватории США ответил на запрос юноши, что работа с астрономическим оборудованием требует использования обеих рук. С мечтой пришлось расстаться. Теперь Поста все более влекла математика. Получив образование в Нью-Йоркском городском колледже, он в 1917 г. удостаивается степени бакалавра. Магистром он стал в 1918 г., а докторскую диссертацию защитил в 1920 г. В ту пору он сотрудничал в Колумбийском университете и внимательно изучал трехтомник «Принципы математики». Его опубликовали в 1910-1913 гг. англичане А. Уайтхед и Б. Рассел. Авторы замахивались на многое: они пытались представить весь набор понятий, аксиом и теорем математики как подмножества соответствующих множеств на языке логики. Нетривиальность и грандиозность задачи импонировали Посту. Практическим выходом его раздумий был вклад в начала современной теории доказательств, который нашел отражение в диссертации. В ней Пост предложил также новую идею построения логических систем. В 1920-1921 гг. Пост пребывал в Принстонском университете. Здесь он вплотную подошел к формулировке теоремы о фундаментальной неполноте любой формальной логики. Эта жемчужина математической логики стала достижением немца Курта Гёделя лишь в 1931 г. В первом номере американского Журнала символической логики за 1936 г. Пост напечатал статью, в которой давал оригинальную интерпретацию понятия «алгоритм». Предложенная им абстрактная конструкция позднее получила название машины Поста. Ученый показал, что любой конечный вычислительный процесс можно свести к манипулированию конечным последовательным набором из нулей и единиц. Одновременно к подобному выводу пришел и А. Тьюринг. Идеи, заключенные в абстрактной машине Поста, предвосхитили изложение принципов построения компьютеров. Предметный указатель E-mail 150 HTML 160 HTML-редактор 160 IP-адрес 131 MP3 118 On-line 150 Off-line 150 SQL — структурированный язык запросов 184 URL-адрес 155 WAV 118 Web-браузер 156 Web-сайт 155 Web-сервер 154 Web-страница 154, 155 Автоматизированная система управления (АСУ) 140 Адаптер 125 Адаптер Ethernet 125 Алгоритм 48, 84 Алгоритм Евклида 48 Алгоритмическая модель 84 Алгоритмически неразрешимая задача 49 Алгоритмический язык 87 Алфавитный подход к измерению информации 18 Антивирусная программа 63 Архитектура компьютера 91 Асимметричный алгоритм 64 База данных 169 Байт 19 Беспроводная связь 125 Бит 19, 21, 22 Битовая глубина цвета 115 Блок бесперебойного питания (ББП) 63 Блок-схема 86 Блочно-последовательный метод 58 Блочный поиск 58 Брандмауэр 63 Векторная графика 116 Ветвление 52 Вещественные числа 108 Вещественные числа в компьютере 108 Видеодиски DVD 40 Видеопамять 94 Винчестер 39 Витая пара 125 Волоконно-оптический кабель 125 Восстановление значения 200 Всемирная паутина (World Wide Web, WWW) 154 Геоинформационная система (ГИС) 163 Гигабайт 19 Гиперссылка 143, 146, 155 Гипертекст 143, 155 Главный ключ 170 Глобальная сеть 129, 130 Граф 70, 71 Данные 9 Двоичная матрица 76 Декодирование 13, 43 Дерево 72 Дерево каталогов 59 Дешифрование 15 Динамическая модель 195 Динамическая память 94 Доктрина информационной безопасности Российской Федерации 231 Доменная система имен 131 Драйвер внешнего устройства 101 Естественные системы 33 244 Предметный указатель Закладка 146 Закон «О правовой охране программ для ЭВМ и баз данных 229 Закон «Об информации, информатизации и защите информации» 229 Закрытый ключ 64 Запрос на выборку 184 Защита информации 60, 61 Защита от шума 44 Защищаемая информация 61 Звуковая информация 117 Звуковая карта 117 Звуковая плата 95 Игра Баше 52 Иерархическая структура 59, 72 Избыточность кода (данных) 44, 174 Индекс 58 Интернет-телефония 152 Информационная культура 130, 224 Информационная модель 67 Информационная революция 218 Информационная система 137, 138 Информационное общество 219 Информационно-поисковая система (ИПС) 139 Информационные ресурсы 213 Информационные связи 34, 36 Информационные услуги 216 Информационный канал 10 Информационный кризис 223 Информационный объект 98, 99 Информационный процесс 34 Информация 9, 10 Искусственная система 33 Исполнитель 46 Источник информации 42 Исходные данные 46 Канал связи 42, 132 Кибернетика 9, 10 Килобайт 19 Кластерная система 122 Ключ поиска 54 Код Бодо 16 Кодирование 13, 43 Кодовая таблица 19 Количество информации 24 Коммутатор 126 Компакт-диски (CD) 40 Компьютер 97 Компьютерная грамотность 129 Компьютерная информационная модель 68 Компьютерная математическая модель 192 Компьютерные вирусы 62 Конструктор запросов 184 Контроллер 93 Контрольная сумма 45 Концентратор 126 Концепция информации антропоцентрическая 11 атрибутивная 10 функциональная 11 Корреляционные зависимости 205 Корреляционный анализ 205 Коэффициент детерминированности 200 Коэффициент корреляции 205 Криптография 15, 64 Критерии поиска 47, 54 Кэш-память 94 Линейное программирование 210 Логическая величина 187 Логическая операция 187 Логическое выражение 187 Локальная компьютерная сеть 123 Магнитная лента 39 Магнитные диски 39 Манипулирование данными 184 Маршрутизатор 126 Математическая модель 193, 194 Математическое программирование 210 Машина Поста 48, 50 Машина Тьюринга 48 Мегабайт 19 Межсетевой экран 63 Меню 103 Меры защиты информации 62 Метод наименьших квадратов 198 Метод половинного деления 23, 57 Метод спуска по дереву 59 Многозадачный режим 101 Многопроцессорный вычислительный комплекс 121 Модель 67 Модель данных 170 Модем 132 Морзе азбука 15 Мультипроцессорная система 122 Набор данных 54 Нанотехнологии 41 Наследственная информация 10 Национальные информационные ресурсы 214 Неопределенность знания 22 предметный указатель 245 Непреднамеренное воздействие 62 Неравномерный код 15 Несанкционированное воздействие 62 Носитель 38 Обработка информации 46 Обратная связь 36 Обучающая система 140 Объем информации 17 Объемный подход к измерению информации 17 Оглавление 143 Однозадачный режим 101 Одноранговая сеть 124 Опасности информационного общества 226 Оперативная память 93 Операционная система 100 Операция отношения 187 Оптимальное планирование 207 Открытый ключ 64 Отношение 171 Офисные программы 99 Пакетная технология передачи информации 133 Параллельные вычисления 122 Передача информации 42, 43, 45 Подсистема 29 Поиск данных 54, 55, 57, 59 Поисковый каталог 157 Поисковый указатель 158 Порты ввода/вывода 95 Последовательный перебор 55 Постоянное запоминающее устройство (ПЗУ) 94 Предметная область 170 Предметный указатель 142 Преступления в сфере компьютерной информации 230 Приемник информации 42 Прикладные программы 98 Принцип открытой архитектуры 93 Провайдер 131 Программа 50, 85 Программное обеспечение 98 Проектирование Web-сайта 161 Пропускная способность 132 Пропускная способность канала связи 43,132 Протокол 155 Протокол TCP/IP 134 Процесс 101 Прямая связь 36 Публикация в Интернете 160 Рабочая станция 96, 125 Рабочий стол 102 Разграничение доступа 63 Разрешение экрана 114 Разрядность дискретизации 117 Распределенные вычисления 122 Растр 114 Растровая графика 116 Регрессионная модель 198 Редактор звука 117 Режим реального времени 140 Резервное копирование 63 Реляционная модель данных 170 Рынок информационных ресурсов 215 Самоуправляемая система 36 Свойства алгоритма 49 дискретность 49 конечность 49 понятность 49 точность 49 Сервер 125 Сетевая операционная система 127 Сеть 71 Система 25 Система автоматического управления (САУ) 140 Система дистанционного обучения 140 Система кодировки 113 Система команд исполнителя (СКИ) 49, 85 Система мультимедиа 96 Система программирования 104 Система управления 10, 35, 36 Система управления базами данных (СУБД) 171 Системная плата 94 Системный анализ 68 Системный подход 30 Системный эффект 28 Системология 25 Следование 52 Служба Интернета 149 Служба передачи файлов 153 Содержательный подход к измерению информации 21 Создание базы данных 178 Социальная информатика 213 Списки рассылки 152 Списки указателей 58 Статистика 196 Статическая память 94 Стенография 14 Структура 26 Структура данных 55, 70, 137 246 Предметный указатель Структурное программирование 87 Схема базы данных 176 Таблица типа «объект-объект» 76 Таблица типа «объект—свойство» 75 Телеграфное сообщение 15 Теория алгоритмов 48 Теория информации 10, 21, 43 Теория кодирования 44 Теория связи 9 Технология «клиент-сервер» 127, 133 Топология сети 126 Трассировка 87 Тренд 199 Троянец 62 Указатель 143 «Умный автомобиль» 226 «Умный дом» 226 Управление 35 Условие выбора 187 Утилита 100 Файловая система 104 Флэш-брелок 40 Флэш-карта 40 Форма (в СУБД) 179 Формат с плавающей запятой 110 Формат с фиксированной запятой 110 Форум прямого общения 152 Хакер 62 Хакерская атака 62 Хранение информации 38, 39, 41 Цветовая модель CMYK 115 Цветовая модель RGB 114 Целевая функция 210 Целостность данных 177 Целые числа 106 Целые числа в компьютере 106 Цикл 52 Цифровая информация 61 Цифровая подпись 65 Цифровой сертификат 65 Частота дискретизации 117 Шина 93 Шифр Цезаря 64 Шифрование 15 Шум 44 Экспертная система 141 Экстраполяция 200 Электронная почта 150 Ядро ОС 103 Язык программирования 85 Ученое издание Семакин Игорь Геннадьевич Хеннер Евгений Карлович ИНФОРМАТИКА И ИКТ. БАЗОВЫЙ УРОВЕНЬ Учебник для 10—11 классов Ведущий редактор О. Полежаева Художник С. Инфантэ Технический редактор Е. Денюкова Корректор Е. Клитина Компьютерная верстка: В. Носенко Подписано в печать 24.01.12. Формат 70x100/16. Уел. печ. л. 20,15. Доп. тираж 15 000 экз. Заказ 1550. Издательство «БИНОМ. Лаборатория знаний» 125167, Москва, проезд Аэропорта, д. 3 Телефон: (499) 157-5272 e-mail: bmom@Lbz.ru, https://www.Lbz.ru Отпечатано ООО ПФ «Полиграфист», Вологда, Челюскинцев, 3, тел. (8172) 72-61-75, E-mail: pr-otdel@pfpoligrafist.com УДК 004.9 ББК 32.97 СЗО Семакин И. Г. СЗО Информатика и ИКТ. Базовый уровень : учебник для 10-11 классов / И. Г. Семакин, Е. К. Хеннер. — 8-е изд. — М. : БИНОМ. Лаборатория знаний, 2012. — 246 с. : ил. ISBN 978-5-9963-0829-3 Учебник входит в УМК «Информатика и ИКТ» для 10-11 классов (базовый уровень). Соответствует федеральному компоненту государственного образовательного стандарта. Содержание учебника опирается на изученный в 8-9 классах основной курс. Основные понятия: информационные процессы, информационные системы, информационные модели, информационные технологии. Рассматриваются компьютерные технологии реализации информационных процессов, работы с информационными системами и моделями. Уделяется внимание актуальным проблемам социальной информатики. В УМК для 10-11 классов входят также практикум и методическое пособие. УДК 004.9 ББК 32.97 По вопросам приобретения обращаться: «БИНОМ. Лаборатория знаний» Телефон: (499)157-5272 e-mail: binom(§)Lbz.ru, https://www.Lbz.ru ISBN 978-5-9963-0829-3 (с) БИНОМ. Лаборатория знаний, 2012 Этот учебник является частью учебно-методического комплекта, обеспечивающего непрерывное и системное преподавание информатики и ИКТ: • в основной школе: учебники для 8 и 9 классов, практикум » в старшей школе: учебник для 10-11 классов, практикум, элективный курс «Информационные системы и модели» Для учителей рекомендуются методические пособия и плакаты. Семакин Игорь Геннадьевич — доктор педагогических наук, кандидат физико-математических наук, профессор кафедры прикладной математики и информатики Пермского государственного национального исследовательского университета. Имеет около 200 научных и учебных публикаций. Ведущий автор и руководитель авторского коллектива общеобразовательного курса информатики и ИКТ для средней школы. Под его руководством и при его участии выпущено множество учебников и учебных пособий для общеобразовательной школы, системы среднего и высшего профессионального образования. Область научных интересов: содержание и методика преподавания информатики, информатизация образования. Хеннер Евгений Карлович — доктор физико-математических наук, профессор. Проректор по научной работе и инновациям Пермского го-fij сударственного национального исследовательского университета, за- ведующий кафедрой дискретной математики и информатики. Лауреат премии Президента РФ в области образования. Автор и соавтор бо-лее 100 работ в области проблем образования, множества учебников и учебных пособий по информатике для школ и вузов. Область научных интересов в сфере образования: научно-педагогические и методические проблемы использования ИКТ в общем и высшем профессиональном образовании.