Версия для печати

Архив документации на OpenNet.ru / Раздел "Программирование в Linux" (Многостраничная версия)

Энциклопедия программиста Linux

Написана Алексеем Паутовым (rldp@ftp.botik.ru) на основе The Linux Programmer's Guide

Вперед:1 Операционная система LINUX

Оглавление


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 2 Ядро LINUX Оглавление: Оглавление Назад: Введение

1 Операционная система LINUX

В марте 1991 Л.В.Торвальдс (Linus Benedict Torvalds) купил мультизадачную операционную систему Minux для своего AT 386. Он использовал ее для того, чтобы создать свою собственную мультизадачную ОС, которую назвал Linux. В сентябре 1991 года он распространил по e-mail ее первый прототип среди пользователей Minux. С этого момента многие стали поддерживать Linux, добавляя драйверы устройств, разрабатывая разные продвинутые приложения и учитывая соглашения POSIX. В настоящее время Linux очень мощная система, но самое замечательное то, что она free. Ведется работа над Linux для других платформ.


Converted on:
Fri Mar 29 14:43:04 EST 1996

Веред: 11 Справочник системных вызовов (в алфавитном порядке) Оглавление: Оглавление Назад: 9 Программирование портов ввода/вывода

 

10 Перенос прикладных программ в Linux

10.1 Введение

Перенос UNIX-приложений под Linux удивительно легок. Linux и его GNU Си библиотека разработана для приложений, переносимых по замыслу; это означает что многие программы компилируются просто через make. Речь идет обо всех программах, не обращающихся к каким-то туманным возможностям частно й реализации, или сильно завязанных на недокументированном или неопределенном поведении, или, скажем, особенном системном вызове.

Linux часто не согласуется со стандартом IEEE Std 1003.1-1988 (POSIX.1), но это никак не сертифицировано. Linux позаимствовал много хорошего от SVID и BSD ветвей UNIX, но опять же не подражал им во всех возможных случаях. Проще говоря, Linux разработан чтобы быть совместимым с другими реализациями UNIX, сделать прикладные программы легко переносимыми, и в ряде случаев продвинут благодаря отобранным лучшим идеям из этих реализаций.

Например, аргумент timeout, посылаемый системному вызову select, на самом деле уменьшается Linux во время опроса. Другие реализации не изменяют это значение вовсе, и программа, скомпилированная под Linux может сломаться. Руководства SunOS и BSD говорят, что модифицируемость указателя timeout дело "будущих реализаций". К сожалению, многие приложения до сих пор предполагают, что timeout неприкосновенен.

Цель этой главы: сделать обзор основных вещей, связанных с переносом приложений в Linux, освещая различия между Linux, POSIX.1, SVID и BSD в следующих областях: обработка сигналов, ввод/вывод с терминала, управление процессами и сбор информации и переносимая условная компиляция.

10.2 Обработка сигналов

С годами определение и семантика сигналов изменялись и совершенствовались различными реализациями UNIX. В настоящее время существует 2 класса сигналов: ненадежные (unreliable) и надежные (reliable). Ненадежные сигналы это те, для которых вызванный однажды обработчик сигнала не остается. Такие "сигналы-выстрелы" должны перезапускать обработчик внутри самого обработчика, если есть желание сохранить сигнал действующим. Из-за этого возможна ситуация гонок, в которой сигнал может прийти до перезапуска обработчика, и тогда он будет потерян, или прийти вовремя, и тогда сработает в соответствии с заданным поведением (например, убьет процесс). Такие сигналы ненадежны, поскольку отлов сигнала и переинсталяция обработчика не являются атомарными операциями.

В семантике ненадежных процессов системные вызовы не повторяются автоматически будучи прерванными поступившим сигналом. Поэтому для обеспечения отработки всех системных вызовов программа должна проверять значение errno после каждого из них и повторять вызовы, если это значение равно EINTR.

По тем же причинам семантика ненадежных сигналов не предоставляет легкого пути реализации атомарных пауз для усыпления процесса до получения сигнала. Ненадежное поведение постоянно перезапускающегося обработчика может привести к неготовности спящего в нужный момент принять сигнал.

Напротив, семантика надежных сигналов оставляет обработчик проинсталированным и ситуация гонок при перезапуске избегается. В то же время определенные сигналы могут быть запущены заново, а атомарная операция паузы доступна через функцию POSIX sigsuspend.

10.2.1 Сигналы SVR4, BSD и POSIX.1

SVR4-реализация сигналов заключается в функциях signal, sigset, sighold, sigrelse, sigignore и sigpause. Функция signal эквивалентна классическим сигналам UNIX V7, она предоставляет только ненадежные сигналы. Остальные функции автоматически перезапускают обработчик. Перезапуск системных вызовов не предусмотрен.

BSD предлагает функции signal, sigvec, sigblock, sigsetmask и sigpause. Все сигналы надежны, а все системные вызовы перезапускаемы Программист имеет возможность это отключить.

В POSIX.1 предоставляются функции sigaction, sigprocmask, sigpending и sigsuspend. Заметьте отсутствие функции signal: она оказалась излишней. Указанные функции работают с надежными сигналами, но перезапуск системных вызовов не определен совсем. Если sigaction используется в BSD или SVR4, то перезапуск системных вызовов по умолчанию отключен. Но он может включаться поднятием флага SA_RESTART.

В итоге, лучший путь работы с сигналами это sigaction, которая позволит точно определить поведение обработчиков сигналов. Однако signal до сих пор используется во многих приложениях и, как мы видели, имеет различную семантику в BSD и SVR4.

10.2.2 Опции сигналов Linux

В Linux определены следующие значения члена sa_flags структуры sigaction.

Заметьте, что POSIX.1 определяет только SA_NOCLDSTOP, а существуют различные другие опции, определенные SVR4, но невозможные под Linux. Во время переноса прикладных программ, которые используют sigaction, вам, возможно, придется обновлять значения sa_flags, чтобы добиться желаемого поведения.

10.2.3 signal в Linux

Функция signal в Linux эквивалентна применению sigaction с опциями SA_ONESHOT и SA_NOMASK, что соответствует классической ненадежной семантике сигналов подобно SVR4.

Если вы хотите использовать signal с семантикой BSD, то для Вас большинство Linux-систем предоставляет совместимую с BSD библиотеку, которую можно прилинковать. Для подключения этой библиотеки вы можете добавить опции

  -I/usr/include/bsd -lbsd
для командной строки компиляции. Перенося приложения, использующие signal, присмотритесь к тому, какие предположения делает ваша программа относительно обработчиков сигналов, и исправьте код (или компилируйте с соответствующими установками), чтобы добиться правильного поведения.

10.2.4 Сигналы, поддерживаемые Linux

Linux поддерживает практически все сигналы, предоставляемые SVR4, BSD и POSIX, за несколькими исключениями:

10.3 Ввод/вывод с терминала

Так же, как для сигналов, управление вводом/выводом имеет 3 различных реализации: под SVR4, BSD и POSIX.1.

SVR4 работает со структурой termio и различными вызовами ioctl (такими, как TCSETA, TCGETA и т.д.) для получения и установки параметров терминала. Эта структура выглядит так:

struct termio {
  unsigned short c_iflag;  /* Input modes */
  unsigned short c_oflag;  /* Output modes */
  unsigned short c_cflag;  /* Control modes */
  unsigned short c_lflag;  /* Line discipline modes */
  char c_line;             /* Line discipline */
  unsigned char c_cc[NCC]; /* Control characters */
};

В BSD вызовы ioctl типа TIOCGETP, TIOCSETP и т.д. работают со структурой sgtty.

В POSIX используется структура termios вместе с различными функциями POSIX.1, такими как tcsetattr и tcgetattr. Структура termios соответствует структуре termio в SVR4, но типы переименованы (например, tcflag_t вместо unsigned short ), и для размера массива c_cc употребляется NCCS.

Под Linux ядром поддерживается и termios POSIX.1, и termio SVR4. Это означает, что, если ваша программа использует оба метода доступа к вводу/выводу на терминал, то ее следует компилировать прямо под Linux. Если вы в чем-то сомневаетесь, то вам понадобится совсем немного знания обоих методов, чтобы исправить termio на termios. Будем, однако, надеяться, что это не потребуется. Обратите внимание на то, пытается ли программа использовать поле c_line структуры termio. Практически для всех приложений оно должно быть равно N_TTY, и если программа предполагает возможность другого упорядочения линий, вы можете заработать ошибку.

Если ваша программа использует реализацию BSD sgtty, вы можете прилинковать libbsd, как описывалось выше. Это обеспечит перекройку ioctl, означающую пересмотр запросов ввода/вывода на терминал в термины структуры termios POSIX, поддерживаемые ядром. При компиляции такой программы, если символы вроде TIOCGETP не определены, вам придется прилинковать libbsd.

10.4 Управление процессами

Такие программы, как ps, top и free, должны иметь способ получения информации от ядра о процессах и ресурсах системы. Аналогично, отладчикам и другим подобным средствам требуется управлять и инспектировать работающий процесс. Такие возможности предоставляет ряд интерфейсов различных версий UNIX, и практически все они либо машинно-зависимы, либо привязаны к конкретной реализации ядра, поэтому не существует универсально доступного интерфейса для такого взаимодействия ядра и процесса.

10.4.1 Подпрограммы kvm

Для прямого доступа к структурам ядра многие системы используют устройство /dev/kmem и подпрограммы kvm_open, kvm_nlist и kvm_read. Программа открывает /dev/kmem, читает символьную таблицу ядра, определяет при помощи этой таблицы расположение данных в работающем ядре и читает соответствующие адреса адресного пространства ядра используя названные подпрограммы. Поскольку это требует согласования между программой пользователя и ядром, размера и формата структур данных, подобные программы перестраиваются для каждой новой версии ядра, типа процессора и т.д.

10.4.2 ptrace и файловая система /proc

Системный вызов ptrace используется в 4.3BSD и SVID для управления процессом и считывания из него информации. Классически он используется отладчиками для, скажем, trap-исполнения процесса (с условными точками останова) или исследования его состояния. Под SVR4 ptrace заменен файловой системой /proc, которая появляется как директория, содержащая единственную точку входа в файл для каждого работающего процесса, называемую ID процесса. Пользовательская программа может открыть файл интересующего ее процесса и совершить над ним различные вызовы ioctl для управления выполнением процесса или получения информации о процессе от ядра. Аналогично, программа может читать или записывать данные напрямую в адресное пространство процесса через файловый дескриптор в файловую систему /proc.

10.4.3 Управление процессами под Linux

Под Linux для управления процессом поддерживается системный вызов ptrace, работающий так же, как 4.3BSD. Для получения информации о процессе или системе Linux также предоставляет файловую систему /proc, но с совершенно другой семантикой. Под Linux /proc состоит из ряда файлов с общесистемной информацией, такой как использование памяти, средняя загруженность, статистика загружаемых модулей и сетевая статистика. Эти файлы общедоступны для read и write; их содержимое можно разбирать, используя scanf. Файловая система /proc под Linux также предоставляет точку входа в директорию для каждого работающего процесса, называемую ID процесса. Она содержит файловые точки входа для информации типа командной линии, связей с текущей директорией и исполняемым файлом, открытых файловых дескрипторов и т.д. Ядро предоставляет всю эту информацию в ответ на запрос read. Такая реализация не противопоставляется файловой системе /proc, находящейся в Plan 9, и имеет некоторые ее недостатки. Например, для ps, чтобы просмотреть таблицу с информацией о всех работающих процессах, нужно пересечь многие директории, открыть и прочитать многие файлы. Для сравнения: подпрограммы kvm в других UNIX-системах считывают структуры ядра напрямую, потратив лишь несколько системных вызовов.

Очевидно, все реализации настолько различны, что перенос приложений, их использующих, может стать серьезной задачей. Следует особо отметить, что файловая система /proc в SVR4 намного грубее, чем в Linux, и их нельзя использовать в одно и том же контексте. На самом деле каждая программа, которая использует kvm или файловую систему /proc SVR4, просто непереносима, и такие фрагменты кода должны быть переписаны.

Вызовы ptrace Linux и BSD похожи, но все же имеют несколько отличий:

Linux не имеет подпрограмм kvm для чтения адресного пространства ядра из пользовательской программы, но в нем есть средства, такие как kmem_ps, в действительности являющиеся версией подобных подпрограмм. Вообще говоря, они непереносимы, и каждый код, использующий kvm, вероятнее всего, зависит от определенных обозначений или от типов данных ядра, поэтому такой код следует признать машинно-зависимым.

10.5 Переносимая условная компиляция

Если вы хотите исправить существующий код для достижения совместимости с Linux, то вам потребуется использовать ifdef...endif для того, чтобы окружить необходимые для этого участки. Не существует стандарта выделения кода, зависящего от операционной системы, но многие программы используют соглашение, принятое в SVR4 для кода System V, в BSD для BSD-кода и для linux в Linux-зависимом коде:

Библиотека GNU C, используемая в Linux, позволяет определять макросы для компиляции программ с разными типами кода:

Если вы определили _BSD_SOURSE, то для библиотеки определится _FAVOR_BSD. Тогда некоторые вещи POSIX и SVR4 будут вести себя, как в BSD. Например, если определено _FAVOR_BSD, setgmp и longgmp будут сохранять и запоминать маску сигнала, а getpgrp будет допускать аргумент PID. Напомним, что вы должны собирать программу с libbsd, чтобы добиться BSD-поведения.

Linux gcc автоматически определяет набор макросов, которые вы можете использовать в своей программе:

Многие программы используют
  #ifdef linux
для окружения Linux-зависимого кода. Заметьте, что Linux поддерживает многие вещи из System V, и поэтому начинать программы, написанные также для System V и BSD, лучше всего с System V-версии. Впрочем, вы можете начинать и с BSD и собирать при помощи libbsd.

10.6 Дополнительные комментарии

Эта глава охватывает многое, связанное с переносом, кроме, правда, отсутствия некоторых системных вызовов, названных в главе о системных вызовах, и потоков (знатоки говорят, что загружаемый потоковый модуль должен быть на ftp.uni-stuttgart.de в pub/systems/linux/isdn). (Добавлено Свеном Голдтом /Sven Goldt/.)


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: Про этот документ Оглавление: Оглавление Назад: Перенос прикладных программ в Linux

11 Справочник системных вызовов (в алфавитном порядке)

_exitкак exit, только с меньшими возможностями (m+c)
acceptустановка связи на сокете (m+c!)
accessпроверка прав доступа пользователя к файлу (m+c)
adjtimexустановка/получение переменных времени ядра (-c)
afs_syscallзарезервированный системный вызов файловой системы andrew (-)
alarmпосылает SIGALARM в назначенное время (m+c)
bdflushсбрасывает буфер на диск (-c)
bindназначает сокет для межпроцессовой коммуникации (m!c)
brkизменяет размеры сегмента данных (mc)
chdirизменяет рабочую директорию (m+c)
chmodизменяет атрибуты файла (m+c)
chownизменяет владение файлом (m+c)
chrootустанавливает новую корневую директорию (mc)
cloneсм. fork (m-)
closeзакрывает файл по ссылке (m+c)
connectсвязывает 2 сокета (m!c)
creatсоздание файла (m+c)
creat_moduleзахватывает память для загружаемого модуля ядра (-)
delete_moduleвыгружает модуль ядра (-)
dupдублирует файловый дескриптор (m+c)
dup2дублирует файловый дескриптор (m+c)
execl, execlp, execle, ...см. execve (m+!c)
execveисполняет файл (m+c)
exitзавершает программу (m+c)
fchdirизменяет рабочую директорию по ссылке ()
fchmodсм. chmode (mc)
fchownизменяет владение файлом (mc)
fcloseзакрывает файл по ссылке (m+!c)
fcntlуправление файлом/файловым дескриптором (m+c)
flockизменение запирания файла (m!c)
forkпорождение потомка (m+c)
fpathconfполучение информации о файле по ссылке (m+!c)
freadчтение массива двоичных данных из потока (m+!c)
fstatполучение статуса файла (m+c)
fstatusполучение статуса файловой системы по ссылке (mc)
fsyncзапись кэша файла на диск (mc)
ftimeинтервал времени + секунды с 1.1.1970 (m!c)
ftruncateизменение размеров файла (mc)
fwriteзапись массива двоичных данных в поток (m+!c)
get_kernel_symsполучение символьной таблицы ядра или ее размеры (-)
getdomainnameполучение имени системной области (m!c)
getdtablesizeполучение размеров таблицы файлового дескриптора (m!c)
getegidполучение эффективного id группы (m+c)
geteuidполучение эффективного id пользователя (m+c)
getgidполучение id группы (m+c)
getgroupsполучение дополнительных групп (m+c)
gethostidполучение уникального идентификатора основной системы (m!c)
gethostnameполучение имени основной системы (m!c)
getitimerполучение значения интервального таймера (mc)
getpagesizeполучение размеров страницы в системе (m-!c)
getpeernameполучение имени присоединенного равного сокета (m!c)
getpgidполучение id группы родительского процесса (+c)
getpgrpполучение id группы родителя текущего процесса (m+c)
getpidполучение id текущего процесса (m+c)
getppidполучение id родительского процесса (m+c)
getpriorityполучение приоритета (процесса, группы, пользователя) (mc)
getrlimitполучение лимита ресурсов (mc)
getrusageсводка ресурсов (m)
getsocknameполучение адреса сокета (m!c)
getsockoptполучение установок опций сокета (m!c)
gettimeofdayполучение времени дня с 1.1.1970 (mc)
getuidполучение действительного id пользователя (m+c)
gttyпока не реализован ()
idleделает процесс кандидатом на свопинг (mc)
init_moduleвставка загружаемого модуля ядра (-)
ioctlработа с символьным устройством (mc)
iopermустановка некоторых прав на ввод/вывод из порта (m-c)
ioplустановка всех прав на ввод/вывод из порта (m-c)
ipcмежпроцессовая коммуникация (-c)
killпосылает сигнал процессу (m+c)
killpgпосылает сигнал группе процесса (mc!)
klogсм. syslog (-!)
linkсоздание жесткой ссылки на существующий файл (m+c)
listenпрослушивание связей сокета (m!c)
llseeklseek для больших файлов
lock пока не реализован ()
lseekизменение позиции ptr файлового дескриптора (m+c)
lstatполучение статуса файла (mc)
mkdirсоздание директории (m+c)
mknodсоздание устройства (mc)
mmap отображение файла в память (mc)
modify_ldtчтение или запись локальной таблицы дескриптора (-)
mountмонтирование файловой системы (mc)
mprotectчтение, запись или исполнение для защищенной памяти (-)
msgctlуправление сообщением ipc (m!c)
msggetполучение id очереди сообщений ipc (m!c)
msgrcvполучение сообщения ipc (m!c)
msgsndпосылка сообщение ipc (m!c)
munmapудаление отображения файла из памяти (mc)
niceизменение приоритета процесса (mc)
openоткрытие файла (m+c)
pathconfполучение информации о файле (m+!c)
pauseждет до сигнала (m+c)
personalityполучение текущей области исполнения для ibcs (-)
pipeсоздание канал (m+c)
profпока не реализован ()
profilисполнение временн'ого профиля (m!c)
ptraceтрассировка потомка (mc)
quotactlпока не реализован ()
readчтение данных из файла (m+c)
readvчтение блоков данных с файла (m!c)
readdirчтение директории (m+c)
readlinkполучение содержимого символической связи (mc)
rebootперезапуск или завтрак в кратере действующего вулкана (-mc)
recvполучение сообщения из присоединенного сокета (m!c)
recvfromполучение сообщения из сокета (m!c)
renameперемещение/переименование файла (m+c)
rmdirудаление пустой директории (m+c)
sbrkсм. brk (mc!)
selectусыпление до действия над файловым дескриптором (mc)
semctlуправление семафором ipc (m!c)
semgetipc выдает идентификатор множества семафоров (m!c)
semopоперация ipc над членами множества семафоров (m!c)
sendпосылка сообщения в присоединенный сокет (m!c)
sendtoпосылка сообщения в сокет (m!c)
setdomainnameустановка имени системной области (mc)
setfsgidустановка id группы файловой системы ()
setfsuidустановка id группы пользователя файловой системы ()
setgidустановка действительного id группы (m+c)
setgroupsустановка дополнительных групп (mc)
sethostidустановка уникального идентификатора основной системы (mc)
sethostnameустановка имени основной системы (mc)
setitimerустановка интервального таймера (mc)
setpgidустановка идентификатора группы процесса (m+c)
setpgrpне имеет никакого эффекта (mc!)
setpriorityустановка приоритета (процесса, группы, пользователя) (mc)
setregidустановка действительного и эффективного идентификатора группы (mc)
setreuidустановка действительного и эффективного идентификатора пользователя (mc)
setrlimitустановка лимита ресурса (mc)
setsidсоздание сессии (+c)
setsockoptизменение опций сокета (mc)
settimeofdayустановка времени дня (с 1.1.1970) (mc)
setuidустановка действительного идентификатора пользователя (m+c)
setupинициализация устройств и монтирование корня (-)
sgetmaskсм. siggetmask (m)
shmatпривязка разделяемой памяти к сегменту данных (m!c)
shmctlманипуляции с разделяемой памятью (m!c)
shmdtотвязка разделяемой памяти от сегмента данных (m!c)
shmgetполучение/создание разделяемого сегмента памяти (m!c)
shutdownзакрытие сокета (m!c)
sigactionустановка/получение обработчика сигнала (m+c)
sigblockблокировка сигналов (m!c)
siggetmaskполучение сигнала, блокирующего текущий процесс (!c)
signalустановка обработчика сигнала (mc)
sigpauseиспользование новой маски сигнала, пока не signal (mc)
sigpendingполучение ожидающих, но заблокированных сигналов (m+c)
sigprocmaskустановка/получение сигнала, блокирующего текущий процесс (+c)
sigsetmaskустановка сигнала, блокирующего текущий процесс (c!)
sigsuspendпереустановка для sigpause (m+c)
sigvecсм. sigaction (m!)
socketсоздание точки коммуникации сокета (m!c)
socketcallсокет вызывает мультиплексор (-)
socketpairсоздание 2 связанных сокетов (m!c)
ssetmaskсм. sigsetmask (m)
statполучение статуса файла (m+c)
statfsполучение статуса файловой системы (mc)
stimeустановка секунд с 1.1.1970 (mc)
swapoffокончание свопинга в файл/устройство (m-c)
swapon начало свопинга в файл/устройство (m-c)
symlinkсоздание символической связи с файлом (m+c)
syncсинхронизация буферов памяти и диска (mc)
syscallисполнение системного вызова по номеру (-!c)
sysconfполучение значения системной переменной (m+!c)
sysfsполучение информации о конфигурированных файловых системах ()
sysinfoполучение системной информации Linux-а (m-)
syslogработа с системной регистрацией (m-c)
systemисполнение команды shell-а (m!c)
timeполучение секунд с 1.1.1970 (m+c)
timesполучение временн'ых характеристик процесса (m+c)
truncateизменение размера файла (mc)
ulimitустановка/получение границ файла (c!)
umaskустановка маски создания файла (m+c)
umountразмонтирование файловых системы (mc)
unameполучение системной информации (m+c)
unlinkудаление незанятого файла (m+c)
uselibиспользование разделяемой библиотеки (m-c)
utimeмодификация временн'ых элементов inode (m+c)
utimesсм. utime (m!c)
vforkсм. fork (m!c)
vhangupвиртуально подвешивает текущий tty (m-c)
vm86войти в виртуальный режим 8086 (m-c)
waitожидание завершения процесса (m+!c)
wait3bsd ждет указанный процесс (m!c)
wait4bsd ждет указанный процесс (mc)
waitpidожидание указанного процесса (m+c)
writeзапись данных в файл (m+c)
writevзапись блоков данных в файл (m!c)

В таблице я использовал такие условные обозначения:

(m)существует manual page
(+)поддерживается POSIX
(-)специфично для Linux
(c)в libc
(!)не одиночный системный вызов, использует другой системный вызов

12 Аббревиатуры

ANSIAmerican National Standard for Information Systems
APIApplication Programming Interface
ASCIIAmerican Standard Code for Information Interchange
AT386Advanced Technology Intel 80386 based PC
FIPSFederal Information Processing Standard
FSFFree Software Foundation
IEEEInstitute of Electrical and Electronics Engineers, Inc.
IPCInter Process Communication
ISOInternational Organization for Standards
POSIXPortable Operating System Interface for uniX
POSIX.1 IEEE Std. 1003.1-1990 Standard for Information Technology: Portable Operating System Interface (POSIX) Part 1: System Application Programming Interface (API)


Converted on:
Fri Mar 29 14:43:04 EST 1996

Оглавление: Оглавление Назад: 11 Справочник системных вызовов (в алфавитном порядке)

Про этот документ

Энциклопедия программиста Linux написана Алексеем Паутовым (rldp@ftp.botik.ru) в 2000 году на основе The Linux Programmer's Guide, которая сгенерирована программой LaTeX2HTML Version 96.1-c (Feb 29, 1996) Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.

Командная строка преобразования:
latex2html lpg.tex.

Конвертировал Andrew Anderson on Fri Mar 29 14:43:04 EST 1996


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 3 Библиотека libc Оглавление: Оглавление Назад:1 Операционная система LINUX

2 Ядро LINUX

Ядро является базой LINUX. Вы можете как угодно переставлять любую из библиотек, но пока есть ядро есть и LINUX. Оно включает в себя драйвера устройств, механизм распределения памяти, управление процессами и связями. Разработчики ядра стараются следовать рекомендациям POSIX, которые иногда осложняют, а иногда упрощают программирование. И если ваша программа поведет себя иначе на новой версии ядра, то вероятнее всего, в этой версии учтена еще какая-нибудь рекомендация POSIX. Информацию о ядре для программиста можно найти в Linux Kernel Hacker's Guide (Справочное руководство по ядру LINUX для программиста).


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 4 Системные вызовы Оглавление: Оглавление Назад:2 Ядро LINUX

3 Библиотека libc

libc: ISO 8859.1, , YP функции, функции кодирования, некоторые базовые теневые программы (по умолчанию не добавлены), ..., старые программы для совместимости с libcompact (по умолчанию не запущены), сообщения об ошибках на английском, французском и немецком, bsd 4.4lite-совместимые программы работы с экраном в libcourses, bsd-совместимые программы в libbsd, программы работы с экраном в libtermcap, поддержка баз данных в libdbm, математика в libm, точка запуска программ в crt0.o (entry to execute programs in crt0.o), байт sex-информации в libeee (автор: объясните мне, лучше, что это такое, вместо того, чтобы ржать), профилирование пространства пользователя в libgmon.

Автор надеется, что кто-нибудь из разработчиков libc напишет эту главу как положено. Все, что автор может на данный момент сказать, это то, что исполняемый формат a.out собираются поменять на elf (executable and lincable format: исполняемый и собираемый формат), что подразумевает изменения и в разделяемых библиотеках. В настоящий момент поддерживаются оба формата.

Большая часть libc находится под лицензией GNU (Library GNU Public License). Хотя попадаются и специальные исключения, например crt0.o. Для коммерческого использования это означает запрет на статически линкуемые программы. Динамически линкуемые программы, однако, тоже являются специальными исключениями.


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 5 ioctl Оглавление: Оглавление Назад: 3 Библиотека libc

4 Системные вызовы

Системный вызов, это требование к ОС (ядру) произвести аппаратно/системно специфическую или привилегированную операцию. В Linux-1.2 были определены 140 системных вызовов. Такие вызовы, как close() реализованы в Linux libc. Эта реализация часто включает в себя макрос, который в конце концов вызывает syscall(). Параметры, передаваемые syscall, это номер системного вызова, перед которым ставятся требуемые аргументы. Номера системных вызовов можно найти в , а обновленные вместе с новой версией libc в . Если появились новые системные вызовы, но их до сих пор нет в libc, вы можете использовать syscall(). Как пример, рассмотрим закрытие файла при помощи syscall (не советуем, однако):

#include <syscall.h>

extern int syscall(int, ...);

int my_close(int filedescriptor)
{
  return syscall(SYS_close, filedescriptor);
}

На i386 системные вызовы ограничены 5-ю аргументами кроме номера вызова из-за аппаратного числа регистров. На другой архитектуре вы можете поискать макрос _syscall в и там посмотреть сколько аргументов поддерживается у вас или $how many developers chose to support$. Макросами _syscall можно пользоваться вместо syscall(), но это не рекомендуется, поскольку макрос может развернуться в функцию, которая уже существует в библиотеке. Поэтому только ядреные хакеры имеют право поиграться с _syscall :). Для демонстрации посмотрим на пример close(), использующий макрос _syscall.

#include <linux/unistd.h>

_syscall1(int, close, int, filedescriptor);

_syscall1 раскрывается в функцию close(), и мы получаем твикс: один close() в libc и один в нашей программе. Возвращаемое syscall() (или _syscall) значение есть -1, если вызов неудачен и 0 или больше в случае успеха. В случае неудачи ошибку можно определить по глобальной переменной errno.

Приведем системные вызовы, возможные в BSD и SYS V, но не допустимые в LINUX: audit(), audition(), fchroot(), getauid(), getdents(), getmsg(), mincore(), poll(), putmsg(), setaudit(), setauid().


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 6 Межпроцессовые коммуникации LINUX Оглавление: Оглавление Назад: 4 Системные вызовы

5 ioctl

iotcl предназначен для контроля ввода/вывода и используется для манипуляций с устройством через файловый дескриптор. Формат ioсtl:
ioctl(unsigned int fd, unsigned int request, unsigned long argument). Возвращаемое значение есть -1 в случае ошибки, 0 и больше если команда (request) прошла так же, как другие системные вызовы. Ядро различает специальные и регулярные файлы. Специальные файлы в основном находятся в /dev и /proc. Они отличаются от регулярных файлов тем, что прячут свое описание в драйвер, тогда как регулярные файлы содержат текст или двоичные данные. Эта философия UNIX, которая позволяет вводить/выводить из любого файла. Но если вам хочется сделать что-нибудь особенное со специальным файлом, вы можете это сделать при ioсtl. В основном ioсtl нужен для борьбы со специальными файлами, но его можно использовать и для обычных.


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 7 Программирование звука Оглавление: Оглавление Назад: 5 ioctl

6 Межпроцессовые коммуникации LINUX

Детальный обзор IPC (interprocess communication facilities), поддерживаемых в Linux.

6.1 Введение

Linux IPC (Inter-process communication) предоставляет средства для взаимодействия процессов между собой. В распоряжении программистов есть несколько методов IPC:

Если эти возможности эффективно используются, то они обеспечивают солидную базу для поддержания идеологии клиент/сервер в любой UNIX-системе, включая Linux.

6.2 Полудуплексные каналы UNIX

6.2.1 Основные понятия

Канал представляет собой средство связи стандартного вывода одного процесса со стандартным вводом другого. Каналы старейший из инструментов IPC, существующий приблизительно со времени появления самых ранних версий оперативной системы UNIX. Они предоставляют метод односторонних коммуникаций (отсюда термин half-duplex) между процессами.

Эта особенность широко используется даже в командной строке UNIX (в shell).

ls | sort | lp

Приведенный выше канал принимает вывод ls как ввод sort, и вывод sort за ввод lp. Данные проходят через полудуплексный канал, перемещаясь (визуально) слева направо.

Хотя большинство из нас использует каналы в программировании на shell довольно часто, мы редко задумываемся о том, что происходит на уровне ядра.

Когда процесс создает канал, ядро устанавливает два файловых дескриптора для пользования этим каналом. Один такой дескриптор используется, чтобы открыть путь ввода в канал (запись), в то время как другой применяется для получения данных из канала (чтение). В этом смысле, канал мало применим практически, так как создающий его процесс может использовать канал только для взаимодействия с самим собой. Рассмотрим следующее изображение процесса и ядра после создания канала:

                     in     <-----
           Process                     Kernel
                     out    ----->

Из этого рисунка легко увидеть, как файловые дескрипторы связаны друг с другом. Если процесс посылает данные через канал (fd0), он имеет возможность получить эту информацию из fd1. Однако этот простенький рисунок отображает и более глобальную задачу. Хотя канал первоначально связывает процесс с самим собой, данные, идущие через канал, проходят через ядро. В частности, в Linux каналы внутренне представлены корректным inode. Конечно, этот inode существует в пределах самого ядра, а не в какой-либо физической файловой системе. Эта особенность откроет нам некоторые привелекательные возможности для ввода/вывода, как мы увидим немного позже.

Зачем же нам неприятности с созданием канала, если мы всего-навсего собираемся поговорить сами с собой? На самом деле, процесс, создающий канал, обычно порождает дочерний процесс. Как только дочерний процесс унаследует какой-нибудь открытый файловый дескриптор от родителя, мы получаем базу для мультипроцессовой коммуникации (между родителем и потомком). Рассмотрим эту измененную версию нашего рисунка:

                     in   <-----            ----->   in
    Parent Process                 Kernel                  Child Process
                     out  ----->            <-----   out

Теперь мы видим, что оба процесса имеют доступ к файловым дескрипторам, которые основывают канал. На этой стадии должно быть принято критическое решение. В каком направлении мы хотим запустить данные? Потомок посылает информацию к родителю или наоборот? Два процесса взаимно согласовываются и "закрывают" неиспользуемый конец канала. Пусть потомок выполняет несколько действий и посылает информацию родителю обратно через канал. Наш новый рисунок выглядел бы примерно так:

                     in   <-----                     in
    Parent Process                 Kernel                  Child Process
                     out                    <-----   out

Конструкция канала теперь полная. Все, что осталось сделать, это использовать его. Чтобы получить прямой доступ к каналу, можно применять системные вызовы, подобные тем, которые нужны для ввода/вывода в файл или из файла на низком уровне (вспомним, что в действительности каналы внутренне представлены как корректный inode).

Чтобы послать данные в канал, мы используем системный вызов write(), а чтобы получить данные из канала системный вызов read(). Вспомним, что системные вызовы ввода/вывода в файл или из файла работают с файловыми дескрипторами! (Однако, не забывайте, что некоторые системные вызовы, как, например, lseek(), не работают с дескрипторами.)

6.2.2 Создание каналов в Си

Создание каналов на языке программирования Си может оказаться чуть более сложным, чем наш простенький shell-пример. Чтобы создать простой канал на Си, мы прибегаем к использованию системного вызова pipe(). Для него требуется единственный аргумент, который является массивом из двух целых (integer), и, в случае успеха, массив будет содержать два новых файловых дескриптора, которые будут использованы для канала. После создания канала процесс обычно порождает новый процесс (вспомним, что процесс-потомок наследует открытые файловые дескрипторы).


  SYSTEM CALL: pipe();
  PROTOTYPE: int pipe( int fd[2] );
  RETURNS: 0 в случае успеха
           -1 в случае ошибки:
              errno = EMFILE (нет свободных дескрипторов)
                      EMFILE (системная файловая таблица переполнена)
                      EFAULT (массив fd некорректен)

  NOTES: fd[0] устанавливается для чтения, fd[1] - для записи.

Первое целое в массиве (элемент 0) установлено и открыто для чтения, в то время как второе целое (элемент 1) установлено и открыто для записи. Наглядно говоря, вывод fd1 становится вводом для fd0. Еще раз отметим, что все данные, проходящие через канал, перемещаются через ядро.

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

main()
{
  int fd[2];

  pipe(fd);
  .
  .
}

Вспомните, что имя массива decays в С это указатель на его первый член. fd это эквивалент &fd[0]. Раз мы установили канал, то ответвим нашего нового потомка:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

main()
{
  int     fd[2];
  pid_t   childpid;

  pipe(fd);
  if ((childpid = fork()) == -1)
  {
     perror("fork");
     exit(1);
  }
  .
  .
}

Если родитель хочет получить данные от потомка, то он должен закрыть fd1, а потомок должен закрыть fd0. Если родитель хочет послать данные потомку, то он должен закрыть fd0, а потомок - fd1. С тех пор как родитель и потомок делят между собой дескрипторы, мы должны всегда быть уверены, что не используемый нами в данный момент конец канала закрыт; EOF никогда не будет возвращен, если ненужные концы канала не закрыты.

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

main()
{
  int     fd[2];
  pid_t   childpid;

  pipe(fd);
  if ((childpid = fork()) == -1)
  {
     perror("fork");
     exit(1);
  }
  if (childpid == 0)
  {
     /* Child process closes up input side of pipe */
     close(fd[0]);
  }
  else
  {
    /* Parent process closes up output side of pipe */
    close(fd[1]);
  }
  .
  .
}

Как было упомянуто ранее, раз канал был установлен, то файловые дескрипторы могут обрабатываться подобно дескрипторам нормальных файлов.

/**************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 **************************************************************************
 MODULE: pipe.c
 **************************************************************************/

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main(void)
{
  int     fd[2], nbytes;
  pid_t   childpid;
  char    string[] = "Hello, world!\n";
  char    readbuffer[80];

  pipe(fd);
  if ((childpid = fork()) == -1)
  {
     perror("fork");
     exit(1);
  }
  if (childpid == 0)
  {
     /* Child process closes up input side of pipe */
     close(fd[0]);
     /* Send "string" through the output side of pipe */
     write(fd[1], string, strlen(string));
     exit(0);
  }
  else
  {
    /* Parent process closes up output side of pipe */
    close(fd[1]);
    /* Read in a string from the pipe */
    nbytes = read(fd[0], readbuffer, sizeof(readbuffer));
    printf("Received string: %s", readbuffer);
  }
  return(0);
}

Часто дескрипторы потомка раздваиваются на стандартный ввод или вывод. Потомок может затем exec() другую программу, которая наследует стандартные потоки. Давайте посмотрим на системный вызов dup():


  SYSTEM CALL: dup();

  PROTOTYPE: int dup( int oldfd );
  RETURNS: new descriptor on success
           -1 on error: errno = EBADF (oldfd некорректен)
                                EBADF ($newfd is out of range$)
                                EMFILE (слишком много дескрипторов для
                                        процесса)

  NOTES: старый дескриптор не закрыт! Оба работают совместно!

Несмотря на то, что старый и новосозданный дескрипторы взаимозаменяемы, мы будем сначала закрывать один из стандартных потоков. Системный вызов dup() использует наименьший по номеру неиспользуемый дескриптор для нового. Рассмотрим:

  .
  .
  childpid = fork();
  if (childpid == 0)
  {
     /* Close up standard input of the child */
     close(0);
     /* Duplicate the input side of pipe to stdin */
     dup(fd[0]);
     execlp("sort", "sort", NULL);
          .
  }

Поскольку файловый дескриптор 0 (stdin) был закрыт, вызов dup() дублировал дескриптор ввода канала (fd0) на его стандартный ввод. Затем мы сделали вызов execlp(), чтобы покрыть код потомка кодом программы sort. Поскольку стандартные потоки exec()-нутой программы наследуются от родителей, это означает, что вход канала ста для потомка стандартным вводом! Теперь все, что первоначальный процесс-родитель посылает в канал, идет в sort.

Существует другой системный вызов, dup2(), который также может использоваться. Этот особенный вызов произошел с Version 7 of UNIX и был поддержан BSD, и теперь требуется по стандарту POSIX.


  SYSTEM CALL: dup2();
  PROTOTYPE: int dup2( int oldfd, int newfd );
  RETURNS: новый дескриптор в случае успеха
           -1 в случае ошибки: errno = EBADF (oldfd некорректен)
                                EBADF ($newfd is out of range$)
                                EMFILE (слишком много дескрипторов для
                                       процесса)
  NOTES: старый дескриптор закрыл dup2()!

Благодаря этому особенному вызову мы имеем закрытую операцию и действующую копию за один системный вызов. Вдобавок, он гарантированно неделим, что означает, что он никогда не будет прерван поступающим сигналом. С первым системным вызовом dup() программисты были вынуждены предварительно выполнять операцию close(). Это приводилок наличию двух системных вызовов с малой степенью защищенности в краткий промежуток времени между ними. Если бы сигнал поступил в течение этого интервала времени, копия дескриптора не состоялась бы. dup2() разрешает для нас эту проблему. Рассмотрим:

  childpid = fork();
  if (childpid == 0)
  {
     /* Close stdin, duplicate the input side of pipe to stdin */
     dup2(0, fd[0]);
     execlp("sort", "sort", NULL);
     .
     .
  }

6.2.3 Каналы: легкий путь!

Если все изложенные выше изыскания кажутся слишком размытым способом создания и использования каналов, то вот альтернатива этому.


LIBRARY FUNCTION: popen();

PROTOTYPE: FILE *popen ( char *command, char *type );
   RETURNS: новый файловый поток в случае успеха
            NULL при неудачном fork() или pipe()

NOTES: создает канал, и выполняет fork/exec, используя command

Эта стандартная библиотечная функция создает полудуплексный канал посредством вызывания pipe() внутренне. Затем она порождает дочерний процесс, запускает Bourne shell и исполняет аргумент command внутри shell. Управление потоком данных определяется вторым аргументом, type. Он может быть "r" или "w", для чтения или записи, но не может быть и то, и другое! Под Linux канал будет открыт в виде, определенном первым символом аргумента "type". Поэтому, если вы попытаетесь ввести "rw", канал будет открыт только в виде "read".

Каналы, созданные popen(), должны быть закрыты pclose(). К этому моменту вы, вероятно, уже использовали [реализовали] popen/pclose share, удивительно похожий на стандартный файловый поток I/O функций fopen() и fclose().


  LIBRARY FUNCTION: pclose();
         PROTOTYPE: int pclose( FILE *stream )
           RETURNS: выход из статуса системного вызова wait4()
                    -1, если "stream" некорректен или облом с wait4()
             NOTES: ожидает окончания связанного каналом процесса,
                    затем закрывает поток.

Функция pclose() выполняет wait4() над процессом, порожденным popen(). Когда она возвращается, то уничтожает канал и файловый поток. Повторим еще раз, что этот эффект аналогичен эффекту, вызываемому функцией fclose() для нормального, основанного на потоке файлового ввода/вывода.

Рассмотрим пример, который открывает канал для команды сортировки и начинает сортировать массив строк:

/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: popen1.c
 *****************************************************************************/
#include <stdio.h>

#define MAXSTRS 5

int main(void)
{
  int  cntr;
  FILE *pipe_fp;
  char *strings[MAXSTRS] = {"echo", "bravo",
                            "alpha", "charlie",
                            "delta"};

  /* Create one way pipe line with call to popen() */
  if ((pipe_fp = popen("sort", "w")) == NULL)
  {
     perror("popen");
     exit(1);
  }
  /* Processing loop */
  for (cntr=0; cntr<MAXSTRS; cntr++)
  {
    fputs(strings[cntr], pipe_fp);
    fputc('\n', pipe_fp);
  }
  /* Close the pipe */
  pclose(pipe_fp);
  return(0);
}

Поскольку popen() использует shell для своих нужд, пригодны все символы и метасимволы shell. Кроме того, с popen() становится возможным использование более продвитутых техник, таких, как переадресация и даже каналирование вывода. Рассмотрим в качестве образца следующие вызовы:

  popen("ls ~scottb", "r");
  popen("sort > /tmp/foo", "w");
  popen("sort | uniq | more", "w");

В качестве другого примера popen(), рассмотрим маленькую программу, открывающую два канала (один для команды ls, другой для сортировки):

/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: popen2.c
 *****************************************************************************/
#include <stdio.h>

int main(void)
{
  FILE *pipein_fp, *pipeout_fp;
  char readbuf[80];

  /* Create one way pipe line with call to popen() */
  if ((pipein_fp = popen("ls", "r")) == NULL)
  {
     perror("popen");
     exit(1);
  }
  /* Create one way pipe line with call to popen() */
  if (( pipeout_fp = popen("sort", "w")) == NULL)
  {
     perror("popen");
     exit(1);
  }
  /* Processing loop */
  while(fgets(readbuf, 80, pipein_fp)) fputs(readbuf, pipeout_fp);
  /* Close the pipes */
  pclose(pipein_fp);
  pclose(pipeout_fp);
  return(0);
}

В качестве последней демонстрации popen(), давайте создадим программу, характерную для открытия канала между отданной командой и именем файла:

/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: popen3.c
 *****************************************************************************/
#include <stdio.h>

int main(int argc, char *argv[])
{
  FILE *pipe_fp, *infile;
  char readbuf[80];

  if (argc != 3) {
     fprintf(stderr, "USAGE:  popen3 [command] [filename]\n");
     exit(1);
  }
  /* Open up input file */
  if ((infile = fopen(argv[2], "rt")) == NULL)
  {
     perror("fopen");
     exit(1);
  }
  /* Create one way pipe line with call to popen() */
  if ((pipe_fp = popen(argv[1], "w")) == NULL)
  {
     perror("popen");
     exit(1);
  }
  /* Processing loop */
  do {
    fgets(readbuf, 80, infile);
    if (feof(infile)) break;
    fputs(readbuf, pipe_fp);
  } while(!feof(infile));
  fclose(infile);
  pclose(pipe_fp);
  return(0);
}

Попробуйте выполнить эту программу с последующими заклинаниями:

  popen3 sort popen3.c
  popen3 cat popen3.c
  popen3 more popen3.c
  popen3 cat popen3.c | grep main

6.2.4 Атомарные (неделимые) операции с каналами

Для того чтобы операция рассматривалась как "атомарная", она не должна прерываться ни по какой причине. Неделимая операция выполняется сразу. POSIX стандарт говорит в /usr/include/posix_lim.h, что максимальные размеры буфера для атомарной операции в канале таковы:

  #define _POSIX_PIPE_BUF 512

Атомарно по каналу может быть получено или передано до 512 байт. Все, что выходит за эти пределы, будет разбито и не будет выполняться атомарно. Однако, в Linux этот атомарный операционный лимит определен в "linux/limits.h" следующим образом:

  #define PIPE_BUF 4096

Как вы можете заметить, Linux предоставляет минимальное количество байт, требуемое POSIX, довольно щедро. Атомарность операции с каналом становится важной, если вовлечено более одного процесса (FIFOS). Например, если количество байтов, записанных в канал, превышает лимит, отпущенный на отдельную операцию, а в канал записываются многочисленные процессы, то данные будут смешаны, т.е. один процесс может помещать данные в канал между записями других.

6.2.5 Примечания к полудуплексным каналам

6.3 Именованные каналы (FIFO: First In First Out):

6.3.1 Именованные каналы (FIFO: First In First Out): основные понятия

Именованные каналы во многом работают так же, как и обычные каналы, но все же имеют несколько заметных отличий.

6.3.2 Создание FIFO

Есть несколько способов создания именованного канала. Первые два могут быть осуществлены непосредственно из shell.

  mknod MYFIFO p
  mkfifo a=rw MYFIFO

Эти две команды выполняют идентичные операции, за одним исключением. Команда mkfifo предоставляет возможность для изменения прав доступа к файлу FIFO непосредственно после создания. При использовании mknod будет необходим вызов команды chmod.

Файлы FIFO могут быть быстро идентифицированы в физической файловой системе посредством индикатора "p", представленного здесь в длинном листинге директории.

$ ls -l MYFIFO
prw-r--r--   1 root     root            0 Dec 14 22:15 MYFIFO|

Также заметьте, что вертикальный разделитель располагается непосредственно после имени файла.

Чтобы создать FIFO на Си, мы можем прибегнуть к использованию системного вызова mknod():


  LIBRARY FUNCTION: mknod();

  PROTOTYPE: int mknod( char *pathname, mode_t mode, dev_t dev );
  RETURNS: 0 в случае успеха,
           -1 в случае ошибки:
              errno = EFAULT (ошибочно указан путь)
                      EACCESS (нет прав)
                      ENAMETOOLONG (слишком длинный путь)
                      ENOENT (ошибочно указан путь)
                      ENOTDIR (ошибочно указан путь)
                      (остальные смотрите в man page для mknod)

  NOTES: Создает узел файловой системы (файл, файл устройства или FIFO)

Оставим более детальное обсуждение mknod() man page, а сейчас давайте рассмотрим простой пример создания FIFO на Си:

  mknod("/tmp/MYFIFO", S_IFIFO|0666, 0);

В данном случае файл "/tmp/MYFIFO" создан как FIFO-файл. Требуемые права "0666", хотя они находятся под влиянием установки umask, как например:

  final_umask = requested_permissions & ~original_umask

Общая хитрость: использовать системный вызов umask() для того, чтобы временно устранить значение umask:

  umask(0);
  mknod("/tmp/MYFIFO", S_IFIFO|0666, 0);

Кроме того, третий аргумент mknod() игнорируется, в противном случае мы создаем файл устройства. В этом случае он должен отметить верхнее и нижнее числа файла устройства.

6.3.3 Операции с FIFO

Операции ввода/вывода с FIFO, по существу, такие же, как для обычных каналов, за одним исключением. Чтобы физически открыть проход к каналу, должен быть использован системный вызов "open" или библиотечная функция. С полудуплексными каналами это невозможно, поскольку канал находится в ядре, а не в физической файловой системе. В нашем примере мы будем трактовать канал как поток, открывая его fopen() и закрывая fclose().

Рассмотрим простой сервер-процесс:

/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: fifoserver.c
 *****************************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <sys/stat.h>
#include <unistd.h>
#include <linux/stat.h>

#define FIFO_FILE       "MYFIFO"

int main(void)
{
  FILE *fp;
  char readbuf[80];

  /* Create the FIFO if it does not exist */
  umask(0);
  mknod(FIFO_FILE, S_IFIFO|0666, 0);
  while(1)
  {
    fp = fopen(FIFO_FILE, "r");
    fgets(readbuf, 80, fp);
    printf("Received string: %s\n", readbuf);
    fclose(fp);
  }
  return(0);
}

Поскольку FIFO блокирует по умолчанию, запустим сервер фоном после того, как его откомпилировали:

$ fifoserver&

Скоро мы обсудим действие блокирования, но сначала рассмотрим следующего простого клиента для нашего сервера:

/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: fifoclient.c
 *****************************************************************************/
#include <stdio.h>
#include <stdlib.h>

#define FIFO_FILE       "MYFIFO"

int main(int argc, char *argv[])
{
  FILE *fp;

  if (argc != 2)
  {
     printf("USAGE: fifoclient [string]\n");
     exit(1);
  }
  if ((fp = fopen(FIFO_FILE, "w")) == NULL)
  {
     perror("fopen");
     exit(1);
  }
  fputs(argv[1], fp);
  fclose(fp);
  return(0);
}

6.3.4 Действие блокирования на FIFO

Если FIFO открыт для чтения, процесс его блокирует до тех пор, пока какой-нибудь другой процесс не откроет FIFO для записи. Аналогично для обратной ситуации. Если такое поведение нежелательно, то может быть использован флаг O_NONBLOCK в системном вызове open(), чтобы отменить действие блокирования.

В примере с нашим простым сервером мы только запустили его в фоне и позволили там осуществлять блокирование. Альтернативой могло бы быть перепрыгивание на другую виртуальную консоль, запуск клиента и переключение туда и обратно, чтобы увидеть результат.

6.3.5 Неизвестный сигнал SIGPIPE

Последнее, что следует отметить, это то, что каналы должны иметь читателя и писателя. Если процесс пробует записать в канал, не имеющий читателя, из ядра будет послан сигнал SIGPIPE. Это необходимо, когда в каналом пользуются более чем два процесса.

6.4 System V IPC


6.4.1 System V IPC: базовые понятия

Вместе с System V AT&T предложил три новых типа IPC средств (очереди сообщений, семафоры и разделяемая память). POSIX еще не стандартизировал эти средства, но большинство разработок их уже поддерживает. Впрочем, Беркли (BSD) в качестве базовой формы IPC использует скорее сокеты, чем элементы System V. Linux имеет возможность использовать оба вида IPC (BSD и System V), хотя мы не будем обсуждать сокеты в этой главе.

Версия System V IPC для LINUX сделана Кришной Баласубраманьяном (Krishna Balasubramanian), balasub@cis.ohio-state.edu.

IPC идентификаторы

Каждый объект IPC имеет уникальный IPC идентификатор. Когда мы говорим "объект IPC", мы подразумеваем очередь единичных сообщений, множество семафоров или разделяемый сегмент памяти. Этот идентификатор требуется ядру для однозначного определения объекта IPC. Например, чтобы сослаться на определенный разделяемый сегмент, единственное, что вам потребуется, это уникальное значение ID, которое привязано к этому сегменту.

Идентификатор IPC уникален только для своего типа объектов. То есть, скажем, возможна только одна очередь сообщений с идентификатором "12345", так же как номер "12345" может иметь какое-нибудь одно множество семафоров или (и) какой-то разделяемый сегмент.

IPC ключи

Чтобы получить уникальный ID нужен ключ. Ключ должен быть взаимно согласован процессом-клиентом и процессом-сервером. Для приложения это согласование должно быть первым шагом в построении среды.

Чтобы позвонить кому-либо по телефону, вы должны знать его номер. Кроме того, телефонная компания должна знать как провести ваш вызов к адресату. И только когда этот адресат ответит, связь состоится.

В случае System V IPC "телефон" соединяет объекты IPC одного типа. Под "телефонной компанией", или методом маршрутизации, следует понимать ключ IPC.

Ключ, генерируемый приложением самостоятельно, может быть каждый раз один и тот же. Это неудобно, полученный ключ может уже использоваться в настоящий момент. Функцию ftok() используют для генерации ключа и для клиента, и для сервера:


  LIBRARY FUNCTION: ftok();

  PROTOTYPE: key_t ftok( char *pathname, char proj );
    RETURNS: новый IPC ключ в случае успеха
             -1 в случае неудачи, errno устанавливается как значение вызова
             stat()


Возвращаемый ftok() ключ инициируется значением inode и нижним числом устройства файла, первого аргумента, и символом, вторым аргументом. Это не гарантирует уникальности, но приложение может проверить наличие коллизий и, если понадобится, сгенерировать новый ключ.


  key_t   mykey;
  mykey = ftok("/tmp/myapp", 'a');

В предложенном выше куске директория /tmp/myapp смешивается с однолитерным идентификатором 'a'. Другой распространенный пример, использовать текущую директорию.


  key_t   mykey;
  mykey = ftok(".", 'a');

Выбор алгоритма генерации ключа полностью отдается на усмотрение прикладного программиста. Так же как и меры по предотвращению ситуации гонок, дедлоков и т.п., любой метод имеет право на жизнь. Для наших демонстрационных целей мы ограничимся ftok(). Если условиться, что каждый процесс-клиент запускается со своей уникальной "домашней" директории, то генерируемые ключи будут всегда удовлетворительны.

Итак, значение ключа, когда оно получено, используется в последующих системных вызовах IPC для создания или улучшения доступа к объектам IPC.

Команда ipcs

Команда ipcs выдает статус всех объектов System V IPC. Ее LINUX-версия также была создана Кришной Баласубраманьяном.


ipcs     -q:  показать только очереди сообщений
ipcs     -s:  показать только семафоры
ipcs     -m:  показать только разделяемую память
ipcs --help:  для любознательных

По умолчанию показываются все три категории объектов. Посмотрим на следующий незатейливый вывод ipcs:


------ Shared Memory Segments --------
shmid     owner     perms     bytes     nattch    status

------ Semaphore Arrays --------
semid     owner     perms     nsems     status

------ Message Queues --------
msqid     owner     perms     used-bytes  messages
0         root      660       5           1

Здесь мы видим одинокую очередь с идентификатором "0". Она принадлежит пользователю root и имеет восьмеричные права доступа 660, или -rw-rw---. Очередь содержит одно пятибайтное сообщение.

Команда ipcs это очень мощное средство, позволяющее подсматривать за механизмом ядреной памяти для IPC-объектов. Изучайте его, пользуйтесь им, благоговейте перед ним.

Команда ipcrm

Команда ipcrm удаляет объект IPC из ядра. Однако, поскольку объекты IPC можно удалить через системные вызовы в программе пользователя (как это делать мы увидим чуть позднее), часто нужды удалять их вручную нет. Особенно это касается всяких программных оболочек. Внешний вид ipcrm прост:


ipcrm <msg | sem | shm>  <IPC ID>

Требуется указать, является ли удаляемый объект очередью сообщений (msg), набором семафоров (sem), или сегментом разделяемой памяти (shm). IPC ID может быть получен через команду ipcs. Напомним, что ID уникален в пределах одного из трех типов объектов IPC, поэтому мы обязаны назвать этот тип явно.

6.4.2 Очереди сообщений

Очереди сообщений: основные концепции

Очереди сообщений представляют собой связный список в адресном пространстве ядра. Сообщения могут посылаться в очередь по порядку и доставаться из очереди несколькими разными путями. Каждая очередь сообщений однозначно определена идентификатором IPC.

Внутренние и пользовательские структуры данных

Ключом к полному осознанию такой сложной системы, как System V IPC, является более тесное знакомство с различными структурами данных, которые лежат внутри самого ядра. Даже для большинства примитивных операций необходим прямой доступ к некоторым из этих структур, хотя другие используются только на гораздо более низком уровне.

Буфер сообщений

Первой структурой, которую мы рассмотрим, будет msgbuf. Его можно понимать как шаблон для данных сообщения. Поскольку данные в сообщении программист определяет сам, он обязан понимать, что на самом деле они являются структурой msgbuf. Его описание находится в linux/msg.h:


/* message buffer for msgsnd and msgrcv calls */
struct msgbuf {
  long mtype;         /* type of message */
  char mtext[1];      /* message text */
};

Структура msgbuf имеет две записи:

mtype

Тип сообщения, представленный натуральным числом. Он обязан быть натуральным!

mtext

Собственно сообщение.

Возможность приписывать тип конкретному сообщению позволяет держать в одной очереди разнородные сообщения. Это может понадобиться, например, когда сообщения процесса-клиента помечаются одним магическим числом, а сообщения сообщения процесса-сервера другим; или приложение ставит в очередь сообщения об ошибках с типом 1, сообщения-запросы с типом 2 и т.д. Ваши возможности просто безграничны.

С другой стороны, старайтесь дать наглядное имя элементу данных сообщения (в примере был mtext). В это поле можно записывать не только массивы символов, но и вообще любые данные в любой форме. Поле действительно полностью произвольно, поэтому вся структура может быть переопределена программистом, например, так:


struct my_msgbuf {
  long    mtype;          /* Message type */
  long    request_id;     /* Request identifier */
  struct  client info;    /* Client information structure */
};

Здесь мы также видим структуру сообщения, но второй элемент заменился на два, причем один из них другая структура! В этом прелесть очередей сообщений, ядро не разбирает данные, какими бы они ни были. Может передаваться любая информация.

Существует, однако, ограничение на максимальный размер сообщения. В LINUX оно определено в linux/msg.h:


#define MSGMAX  4056   /* <= 4056   max size of message (bytes) */

Сообщения не могут быть больше, чем 4056 байт, сюда входит и элемент mtype, который занимает 4 байта (long).

Структура ядра msg

Ядро хранит сообщения в очереди структуры msg. Она определена в linux/msg.h:


/* one msg structure for each message */
struct msg {
  struct msg *msg_next;   /* next message on queue */
  long  msg_type;
  char *msg_spot;         /* message text address */
  short msg_ts;           /* message text size */
};

msg_next

Указатель на следующее сообщение в очереди. Сообщения объединены в односвязный список и находятся в адресном пространстве ядра.

msg_type

Тип сообщения, каким он был объявлен в msgbuf.

msg_spot

Указатель на начало тела сообщения.

msg_ts

Длина текста (или тела) сообщения.

Структура ядра msqid_ds

Каждый из трех типов IPC-объектов имеет внутреннее представление, которое поддерживается ядром. Для очередей сообщений это структура msqid_ds. Ядро создает, хранит и сопровождает образец такой структуры для каждой очереди сообщений в системе. Она определена в linux/msg.h следующим образом:


/* one msqid structure for each queue on the system */
struct msqid_ds {
  struct ipc_perm msg_perm;
  struct msg *msg_first;  /* first message on queue */
  struct msg *msg_last;   /* last message in queue */
  time_t msg_stime;       /* last msgsnd time */
  time_t msg_rtime;       /* last msgrcv time */
  time_t msg_ctime;       /* last change time */
  struct wait_queue *wwait;
  struct wait_queue *rwait;
  ushort msg_cbytes;
  ushort msg_qnum;
  ushort msg_qbytes;      /* max number of bytes on queue */
  ushort msg_lspid;       /* pid of last msgsnd */
  ushort msg_lrpid;       /* last receive pid */
};

Хотя большинство элементов этой структуры вас будет мало волновать, для какой-то законченности вкратце поясним каждый:

msg_perm

Экземпляр структуры ipc_perm, определенной в linux/ipc.h . Она содержит информацию о доступе для очереди сообщений, включая права доступа и информацию о создателе сообщения (uid и т.п.).

msg_first

Ссылка на первое сообщение в очереди (голова списка).

msg_last

Ссылка на последний элемент списка (хвост списка).

msg_stime

Момент времени (time_t) посылки последнего сообщения из очереди.

msg_rtime

Момент времени последнего изъятия элемента из очереди.

msg_ctime

Момент времени последнего изменения, проделанного в очереди (подробнее об этом позже).

wwait

и

rwait
Указатели на очередь ожидания ядра (wait queue). Они используются, когда операция над очередью сообщений переводит процесс в состояние спячки (то есть, очередь переполнена, и процесс ждет открытия).

msg_cbytes

Число байт, стоящих в очереди (суммарный размер всех сообщений).

msg_qnum

Количество сообщений в очереди на настоящий момент.

msg_qbytes

Максимальный размер очереди.

msg_lspid

PID процесса, пославшего последнее в очереди сообщение.

msg_lrpid

PID последнего процесса, взявшего из очереди сообщение.

Структура ядра ipc_perm

Информацию о доступе к IPC-объектам ядро хранит в структуре ipc_perm. Например, описанная выше структура очереди сообщений содержит одну структуру типа ipc_perm в качестве элемента. Следующее ее определение дано в linux/ipc.h.


struct ipc_perm
{
  key_t  key;
  ushort uid;   /* owner euid and egid */
  ushort gid;
  ushort cuid;  /* creator euid and egid */
  ushort cgid;
  ushort mode;  /* access modes see mode flags below */
  ushort seq;   /* slot usage sequence number */
};

Все приведенное выше говорит само за себя. Сохраняемая отдельно вместе с ключом IPC-объекта информация содержит данные о владельце и создателе этого объекта (они могут различаться). Режимы восьмеричного доступа также хранятся здесь, как unsigned short. Наконец, сохраняется порядковый номер использования слота (slot usage sequence). Каждый раз когда IPC объект закрывается через системный вызов (уничтожается), этот номер уменьшается на максимальное число объектов IPC, которые могут находиться в системе. Касается вас это значение? Нет.

ЗАМЕЧАНИЕ:Все это в плане системной безопасности может иметь принципиальное значение, и хорошо рассмотрено в книге Richard Stevens' UNIX Network Programming, pp. 125.

Системный вызов: msgget()

Системный вызов msgget() нужен для того, чтобы создать очередь сообщений или подключиться к существующей.


  SYSTEM CALL: msgget()

  PROTOTYPE: int msgget( key_t key, int msgflg );
    RETURNS: идентификатор очереди сообщений в случае успеха;
             -1 в случае ошибки. При этом
                errno = EACCESS (доступ отклонен)
                        EEXIST (такая очередь уже есть, создание невозможно)
                        EIDRM (очередь помечена как удаляемая)
                        ENOENT (очередь не существует)
                        ENOMEM (не хватает памяти для создания новой очереди)
                        ENOSPC (исчерпан лимит на количество очередей)

Первый аргумент msgget() значение ключа (мы его получаем при помощи ftok()). Этот ключ сравнивается с ключами уже существующих в ядре очередей. При этом операция открытия или доступа к очереди зависит от содержимого аргумента msgflg:

IPC_CREAT

Создает очередь, если она не была создана ранее.

IPC_EXCL

При использовании совместно с IPC_CREAT, приводит к неудаче если очередь уже существует.

Вызов msgget() с IPC_CREAT, но без IPC_EXCL всегда выдает идентификатор (существующей с таким ключом или созданной) очереди. Использование IPC_EXCL вместе с IPC_CREAT либо создает новую очередь, либо, если очередь уже существует, заканчивается неудачей. Самостоятельно IPC_EXCL бесполезен, но вместе c IPC_CREAT он дает гарантию, что ни одна из существующих очередей не открывается для доступа.

Восьмеричный режим может быть OR-нут в маску доступа. Каждый IPC-объект имеет права доступа, аналогичные правам доступа к файлу в файловой системе UNIX!

Напишем оберточную функцию для открытия или создания очереди сообщений:


int open_queue( key_t keyval )
{
  int     qid;

  if ((qid = msgget( keyval, IPC_CREAT | 0660 )) == -1)
  {
     return(-1);
  }
  return(qid);
}

Отметьте использование точного ограничителя доступа 0660. Эта небольшая функция возвращает идентификатор очереди (int) или -1 в случае ошибки. Единственный требуемый аргумент: ключевое значение.

Системный вызов: msgsnd()

Получив идентификатор очереди, мы можем выполнять над ней различные действия. Чтобы поставить сообщение в очередь, используйте системный вызов msgsnd():


  SYSTEM CALL: msgsnd();

  PROTOTYPE: int msgsnd(int msqid, struct msgbuf *msgp, int msgsz,
                        int msgflg );
  RETURNS:   0 в случае успеха
             -1 в случае ошибки:
                errno = EAGAIN (очередь переполнена, и установлен IPC_NOWAIT)
                        EACCES (доступ отклонен, нет разрешения на запись)
                        EFAULT (адрес msgp недоступен, неверно...)
                        EIDRM (очередь сообщений удалена)
                        EINTR (получен сигнал во время ожидания печати)
                        EINVAL (ошибочный идентификатор очереди сообщений,
                                неположительный тип сообщения или
                                неправильный размер сообщения)
                        ENOMEM (не хватает памяти для копии буфера сообщения)

Первый аргумент msgsnd: идентификатор нашей очереди, возвращенный предварительным вызовом msgget. Второй аргумент msgp это указатель на редекларированный и загруженный буфер сообщения. Аргумент msgsz содержит длину сообщения в байтах, не учитывая тип сообщения (long 4 байта).

Аргумент msgflg может быть нулем или:

IPC_NOWAIT

Если очередь переполнена, то сообщение не записывается в очередь, и управление передается вызывающему процессу. Если эта ситуация не обрабатывается вызывающим процессом, то он приостанавливается (блокируется), пока сообщение не будет прочитано.

Напишем еще одну оберточную функцию для посылки сообщения:

int send_message( int qid, struct mymsgbuf *qbuf )
{
  int     result, length;

  /* The length is essentially the size of the structure minus
     sizeof(mtype) */
  length = sizeof(struct mymsgbuf) - sizeof(long);
  if ((result = msgsnd(qid, qbuf, length, 0)) == -1)
  {
     return(-1);
  }
  return(result);
}
Эта функция пытается послать сообщение, лежащее по указанному адресу (qbuf), в очередь сообщений, идентифицированную qid. Напишем небольшую утилиту с нашими двумя оберточными функциями:


#include <stdio.h>
#include <stdlib.h>
#include <linux/ipc.h>
#include <linux/msg.h>

main()
{
  int    qid;
  key_t  msgkey;
  struct mymsgbuf
  {
    long    mtype;          /* Message type */
    int     request;        /* Work request number */
    double  salary;         /* Employee's salary */
  } msg;

  /* Generate our IPC key value */
  msgkey = ftok(".", 'm');
  /* Open/create the queue */
  if ((qid = open_queue( msgkey)) == -1) {
     perror("open_queue");
     exit(1);
  }
  /* Load up the message with arbitrary test data */
  msg.mtype   = 1;        /* Message type must be a positive number! */
  msg.request = 1;        /* Data element #1 */
  msg.salary  = 1000.00;  /* Data element #2 (my yearly salary!) */
  /* Bombs away! */
  if ((send_message( qid, &msg )) == -1) {
     perror("send_message");
     exit(1);
  }
}

После создания/открытия нашей очереди принимаемся за загрузку буфера сообщения с тестовыми данными (обратите внимание на отсутствие текстовых данных для иллюстрации нашего положения о посылке двоичной информации). Вызов нашего send_message доставит сообщение в очередь.

Теперь, когда мы имеем сообщение в очереди, попытайтесь при помощи ipcs посмотреть на статус нашей очереди. Обсудим, как забрать из очереди сообщение. Для этого используется системный вызов msgrcv():


  SYSTEM CALL: msgrcv();
  PROTOTYPE: int msgrcv(int msqid, struct msgbuf *msgp, int msgsz,
                        long mtype, $$)
    RETURNS: число байт, скопированных в буфер сообщения
             -1 в случае ошибки:
                errno = E2BIG (длина сообщения больше, чем msgsz, $$)
                        EACCES (нет права на чтение)
                        EFAULT (адрес, на который указывает msgp, ошибочен)
                        EIDRM (очередь была уничтожена в период изъятия
                               сообщения)
                        EINTR (прервано поступившим сигналом)
                        EINVAL (msgqid ошибочен или msgsz меньше 0)
                        ENOMSG (установлен IPC_NOWAIT, но в очереди нет
                                ни одного сообщения, удовлетворяющего
                                запросу)

Конечно, первый аргумент определяет очередь, из которой будет взято сообщение (должен быть возвращен сделанным предварительно вызовом msgget). Второй аргумент (msgp) представляет собой адрес буфера, куда будет положено изъятое сообщение. Третий аргумент, msgsz, ограничивает размер структуры-буфера без учета длины элемента mtype. Еще раз повторимся, это может быть легко вычислено:
  msgsz = sizeof(struct mymsgbuf) - sizeof(long);
Четвертый аргумент, mtype это тип сообщения, изымаемого из очереди. Ядро будет искать в очереди наиболее старое сообщение такого типа и вернет его копию по адресу, указанному аргументом msgp. Существует один особый случай: если mtype = 0, то будет возвращено наиболее старое сообщение, независимо от типа.

Если IPC_NOWAIT был послан флагом, и нет ни одного удовлетворительного сообщения, msgrcv вернет вызывающему процессу ENOMSG. В противном случае вызывающий процесс блокируется, пока в очередь не прибудет сообщение, соответствующее параметрам msgrcv(). Если, пока клиент ждет сообщения, очередь удаляется, то ему возвращается EIDRM. EINTR возвращается, если сигнал поступил, пока процесс находился на промежуточной стадии между ожиданием и блокировкой.

Давайте рассмотрим функцию-переходник для изъятия сообщения из нашей очереди.


int read_message( int qid, long type, struct mymsgbuf *qbuf )
{
  int     result, length;

  /* The length is essentially the size of the structure minus
     sizeof(mtype) */
  length = sizeof(struct mymsgbuf) - sizeof(long);
  if ((result = msgrcv( qid, qbuf, length, type,  0)) == -1)
  {
     return(-1);
  }
  return(result);
}

После успешного изъятия сообщения удаляется из очереди и его ярлык.

Бит MSG_NOERROR в msgflg предоставляет некоторые дополнительные возможности. Если физическая длина сообщения больше, чем msgsz, и MSG_NOERROR установлен, то сообщение обрезается и возвращается только msgsz байт. Нормальный же msgrcv() возвращает -1 (E2BIG), и сообщение остается в очереди до последующих запросов. Такое поведение можно использовать для создания другой оберточной функции, которая позволит нам "подглядывать" внутрь очереди, чтобы узнать, пришло ли сообщение, удовлетворяющее нашему запросу.


int peek_message( int qid, long type )
{
  int     result, length;

  if ((result = msgrcv( qid, NULL, 0, type,  IPC_NOWAIT)) == -1)
  {
     if (errno == E2BIG) return(TRUE);
  }
  return(FALSE);
}

Выше вы заметили отсутствие адреса буфера и длины. В этом конкретном случае мы хотели, чтобы вызов прошел неудачно. Однако мы проверили возвращение E2BIG, которое должно показать, существует ли сообщение затребованного типа. Оберточная функция возвращает TRUE в случае успеха, и FALSE в противном случае. Отметьте также установленный флаг IPC_NOWAIT, который помешает блокировке, о которой мы говорили раньше.

Системный вызов: msgctl()

Благодаря использованию функций-переходников вы имеете некий элегантный подход к созданию и использованию очередей сообщений в ваших приложениях. Теперь коснемся непосредственно манипулирования внутренними структурами, связанными с данной очередью сообщений.

Для осуществления контроля над очередью предназначен системный вызов msgсtl().


  SYSTEM CALL: msgctl()
    PROTOTYPE: int msgctl ( int msgqid, int cmd, struct msqid_ds *buf );
      RETURNS: 0 в случае успеха
               -1 в случае неудачи
                  errno = EACCES (нет прав на чтение и cmd есть IPC_STAT)
                          EFAULT (адрес, на который указывает buf, ошибочен
                                  для команд IPC_SET и IPC_STAT)
                          EIDRM  (очередь была уничтожена во время запроса)
                          EINVAL (ошибочный msqid или msgsz меньше 0)
                          EPERM  (IPC_SET- или IPC_RMID-команда была
                                 послана процессом, не имеющим прав на запись
                                 в очередь)

Теперь из общих соображений ясно, что прямые манипуляции с внутреностями ядра могут привести к очень занимательным последствиям. К сожалению, по-настоящему весело будет только тому, кто любит вдребезги и с наслаждением крушить подсистему IPC. Однако, при использовании msgctl() с некоторыми командами вероятность огорчительных результатов не очень велика. Вот их и рассмотрим:

IPC_STAT

Сохраняет по адресу buf структуру msqid_ds для очереди сообщений.

IPC_SET

Устанавливает значение элемента ipc_perm структуры msqid. Значения выбирает из буфера.

IPC_RMID

Удаляет очередь из ядра.

Вернемся к нашему разговору о внутреннем представлении очереди сообщений: msqid_ds. Ядро держит экземпляр этой структуры для каждой очереди, существующей в системе. IPC_STAT дает возможность заиметь копию такой структуры для испытаний. Посмотрим на оберточную функцию, которая берет эту структуру и размещает копию по указанному адресу:


int get_queue_ds( int qid, struct msgqid_ds *qbuf )
{
  if (msgctl( qid, IPC_STAT, qbuf) == -1)
  {
     return(-1);
  }
  return(0);
}

Если копирование во внутренний буфер невозможно, то вызывающей функции возвращается -1. Если же все прошло нормально, то возвращается 0, и посланный буфер должен содержать копию внутренней структуры данных для очереди с идентификатором qid.

Что же мы можем делать с полученной копией структуры? Единственное, что можно поменять, это элемент ipc_perm. Это права доступа очереди, информация о создателе и владельце очереди. Однако и отсюда менять позволено только mode, uid и gid.

Давайте напишем оберточную функцию, изменяющую режим доступа очереди. Режим должен быть передан как массив символов (например, "660").


int change_queue_mode( int qid, char *mode )
{
  struct msqid_ds tmpbuf;

  /* Retrieve a current copy of the internal data structure */
  get_queue_ds( qid, &tmpbuf);
  /* Change the permissions using an old trick */
  sscanf(mode, "%ho", &tmpbuf.msg_perm.mode);
  /* Update the internal data structure */
  if (msgctl( qid, IPC_SET, &tmpbuf) == -1)
  {
     return(-1);
  }
  return(0);
}

Мы взяли текущую копию внутренней структуры данных посредством вызова нашей get_queue_ds; затем sscanf() меняет элемент mode структуры msg_perm. Однако ничего не произойдет, пока msgctl c IPC_SET не обновил внутреннюю версию.

ОСТОРОЖНО! Изменяя права доступа, можно случайно лишить прав себя самого! Помните, что IPC-объекты не исчезают, пока они не уничтожены должным образом или не перезагружена система. Поэтому то, что Вы не видите очереди ipcs, не означает, что ее нет на самом деле.

Для иллюстрации этого факта расскажу анекдотический случай из своей практики. Я занимался выполнением лабораторной работы по очередям. Все шло нормально, я тестировал свою программу с разными параметрами, как вдруг, при указании прав доступа ``600'' вместо ``660'', я лишился доступа к своей же очереди! Я не смог тестировать очереди сообщений в любой точке моего каталога, а когда я попытался вызвать функцию ftok() для создания ключа IPC, я попытался обратиться к очереди, прав доступа к которой теперь не имел. Кончилось тем, что я выловил локального системного администратора и потратил час на то, чтобы объяснить ему, что произошло, и зачем мне понадобилась команда ipcrm, grrrr.

После того, как сообщение взято из очереди, оно удаляется. Однако, как отмечалось ранее, IPC-объекты остаются в системе до персонального удаления или перезапуска всей системы. Поэтому наша очередь сообщений все еще существует в ядре и пригодна к употреблению в любое время, несмотря на то, что последнее его соообщение уже давно на небесах. Чтобы и нашу очередь с миром отправить туда же, нужен вызов msgctl(), использующий команду IPC_RMID:


int remove_queue(int qid)
{
  if (msgctl( qid, IPC_RMID, 0) == -1)
  {
     return(-1);
  }
  return(0);
}

Эта функция-переходник возвращает 0, если очередь удалена без инцедентов, в противном случае ввыдается -1. Удаление очереди неделимо (атомарно) и попытка любого обращения к ней будет безуспешной.

msgtool: интерактивное управление очередью сообщений

Мало кто станет отрицать непосредственную выгоду от возможности в любой момент получить точную техническую информацию. Подобные материалы представляют собой мощный механизм для обучения и исследования новых областей. Однако, неплохо было бы добавить к технической информации и реальные примеры. Это непременно ускорит и укрепит процесс обучения.

До сих пор все то хорошее, что мы сделали, это оберточные функции для манипуляций с очередями сообщений. Хотя они чрезвычайно полезны, ими неудобно пользоваться для дальнейшего обучения и экспериментов. Существует средство, позволяющее работать с IPC-очередями из командной строки: msgtool. Хотя msgtool будет использован в целях обучения, он пригодится и реально при написании скриптов.

Фон

Поведение msgtool зависит от аргументов командной строки, что удобно для вызова из скрипта shell. Позволяет делать все что угодно, от создания, посылки и получения сообщений до редактирования прав доступа и удаления очереди. Изначально данными сообщений могут быть только литерные массивы. Упражнение: измените это так, чтобы можно было посылать и другие данные.

Синтаксис командной строки

Передача сообщений

msgtool s (type) "text"

Прием сообщений

msgtool r (type)

Изменение режима доступа

msgtool m (mode)

Удаление сообщения

msgtool d

Примеры

msgtool  s   1 test
msgtool  s   5 test
msgtool  s   1 "This is a test"
msgtool  r   1
msgtool  d
msgtool  m   660

Источник

Следующее, что мы рассмотрим, это исходный текст msgtool. Его следует компилировать в версии системы, которая поддерживает System V IPC. Убедитесь в наличии System V IPC в ядре, когда будете собирать программу!

На полях отметим, что наша утилита будет всегда создавать очередь, если ее не было.

ЗАМЕЧАНИЕ: Поскольку msgtool использует ftok() для генерации ключей IPC, вы можете нарваться на конфликты, связанные с директориями. Если вы где-то в скрипте меняете директории, то все это наверняка не сработает. Это обходится путем более явного указания пути в msgtool, вроде "/tmp/msgtool", или даже запроса пути из командной строки вместе с остальными аргументами.


/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: msgtool.c
 *****************************************************************************
 A command line tool for tinkering with SysV style Message Queues
 *****************************************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <ctype.h>
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/msg.h>

#define MAX_SEND_SIZE 80

struct mymsgbuf {
  long mtype;
  char mtext[MAX_SEND_SIZE];
};

void send_message(int qid, struct mymsgbuf *qbuf, long type, char *text);
void read_message(int qid, struct mymsgbuf *qbuf, long type);
void remove_queue(int qid);
void change_queue_mode(int qid, char *mode);
void usage(void);

int main(int argc, char *argv[])
{
  key_t key;
  int   msgqueue_id;
  struct mymsgbuf qbuf;

  if (argc == 1) usage();
  /* Create unique key via call to ftok() */
  key = ftok(".", 'm');
  /* Open the queue - create if necessary */
  if ((msgqueue_id = msgget(key, IPC_CREAT|0660)) == -1) {
     perror("msgget");
     exit(1);
  }
  switch(tolower(argv[1][0]))
  {
    case 's': send_message(msgqueue_id, (struct mymsgbuf *)&qbuf,
                           atol(argv[2]), argv[3]);
              break;
    case 'r': read_message(msgqueue_id, &qbuf, atol(argv[2]));
              break;
    case 'd': remove_queue(msgqueue_id);
              break;
    case 'm': change_queue_mode(msgqueue_id, argv[2]);
              break;
    default: usage();
  }
  return(0);
}

void send_message(int qid, struct mymsgbuf *qbuf, long type, char *text)
{
  /* Send a message to the queue */
  printf("Sending a message ...\n");
  qbuf->mtype = type;
  strcpy(qbuf->mtext, text);
  if ((msgsnd(qid, (struct msgbuf *)qbuf, strlen(qbuf->mtext)+1, 0)) ==-1)
  {
     perror("msgsnd");
     exit(1);
  }
}

void read_message(int qid, struct mymsgbuf *qbuf, long type)
{
  /* Read a message from the queue */
  printf("Reading a message ...\n");
  qbuf->mtype = type;
  msgrcv(qid, (struct msgbuf *)qbuf, MAX_SEND_SIZE, type, 0);
  printf("Type: %ld Text: %s\n", qbuf->mtype, qbuf->mtext);
}

void remove_queue(int qid)
{
  /* Remove the queue */
  msgctl(qid, IPC_RMID, 0);
}

void change_queue_mode(int qid, char *mode)
{
  struct msqid_ds myqueue_ds;

  /* Get current info */
  msgctl(qid, IPC_STAT, &myqueue_ds);
  /* Convert and load the mode */
  sscanf(mode, "%ho", &myqueue_ds.msg_perm.mode);
  /* Update the mode */
  msgctl(qid, IPC_SET, &myqueue_ds);
}

void usage(void)
{
  fprintf(stderr, "msgtool - A utility for tinkering with msg queues\n");
  fprintf(stderr, "\nUSAGE: msgtool (s)end <type> <messagetext>\n");
  fprintf(stderr, "               (r)ecv <type>\n");
  fprintf(stderr, "               (d)elete\n");
  fprintf(stderr, "               (m)ode <octal mode>\n");
  exit(1);
}

6.4.3 Семафоры

Семафоры: Основные концепции

Семафоры лучше всего предствлять себе как счетчики, управляющие доступом к общим ресурсам. Чаще всего они используются как блокирующий механизм, не позволяющий одному процессу захватить ресурс, пока этим ресурсом пользуется другой. Семафоры часто подаются как наиболее трудные для восприятия из всех трех видов IPC-объектов. Для полного понимания, что же такое семафор, мы их немного пообсуждаем, прежде чем переходить к системным вызовам и операционной теории.

Слово семафор в действительности является старым железнодорожным термином, соответствующим "рукам", не дающим траекториям каров пересекаться на перекрестках. То же самое можно сказать и про семафоры. Семафор в положении ON (руки пондяты вверх) если ресурс свободен и в положении OFF (руки опущены) если ресурс недоступен (надо ждать).

Этот пример неплохо показал суть работы семафора, однако важно знать, что в IPC используются множества семафоров, а не отдельные экземпляры. Разумеется, множество может содержать и один семафор, как в нашем железнодорожном примере.

Возможен другой подход к семафорам: как к счетчикам ресурсов. Приведем другой пример из жизни. Вообразим себе спулер, управляющий несколькими принтерами, каждый из которых обрабатывает по нескольку заданий. Гипотетический менеджер печати будет использовать множество семафоров для установления доступа к каждому из принтеров.

Предположим, что в комнате имеются 5 работающих принтеров. Наш менеджер конструирует 5 семафоров: по одному на каждый принтер. Поскольку каждый принтер может обрабатывать только по одному запросу за раз, все семафоры устанавливаются в 1, что означает готовность всех принтеров.

John послал запрос на печать. Менеджер смотрит на семафоры и находит первый из них со значением 1. Перед тем, как запрос John попадет на физическое устройство, менеджер печати уменьшит соответствующий семафор на 1. Теперь значение семафора есть 0. В мире семафоров System V нуль означает стопроцентную занятость ресурса на семафоре. В нашем примере на принтере не будет ничего печататься, пока значение семафора не изменится.

Когда John напечатал все свои плакаты, менеджер печати увеличивает семафор на 1. Теперь его значение вновь равно 1 и принтер может принимать задания снова.

Не смущайтесь тем, что все семафоры инициализируются единицей. Семафоры, трактуемые как счетчики ресурсов, могут изначально устанавливаться в любое натуральное число, не только в 0 или 1. Если бы наши принтеры умели печатать по 500 документов за раз, мы могли бы проинициализировать семафоры значением 500, уменьшая семафор на 1 при каждом поступающем задании и увеличивая после его завершения. Как вы увидите в следующей главе, семафоры имеют очень близкое отношение к разделяемым участкам памяти, играя роль сторожевой собаки, кусающей нескольких писателей в один и тот же сегмент памяти (имеется в виду машинная память).

Перед тем, как копаться в системных вызовах, коротко пробежимся по внутренним структурам данных, с которыми имеют дело семафоры.

Структура ядра semid_ds

Так же, как и для очередей сообщений, ядро отводит часть своего адресного пространства под структуру данных каждого множества семафоров. Структура определена в linux/sem.h:


/* One semid data structure for each set of semaphores in the system. */
struct semid_ds {
  struct ipc_perm sem_perm;       /* permissions .. see ipc.h */
  time_t          sem_otime;      /* last semop time */
  time_t          sem_ctime;      /* last change time */
  struct sem      *sem_base;      /* ptr to first semaphore in array */
  struct wait_queue *eventn;
  struct wait_queue *eventz;
  struct sem_undo  *undo;         /* undo requests on this array */
  ushort          sem_nsems;      /* no. of semaphores in array */
};

Так же, как с очередями сообщений, операции с этой структурой проводятся с помощью системных вызовов, а не грязными скальпелями. Вот некоторые описания полей.

sem_perm

Это пример структуры ipc_perm, которая описана в linux/ipc.h. Она содержит информацию о доступе к множеству семафоров, включая права доступа и информацию о создателе множества (uid и т.д.).

sem_otime

Время последней операции semop() (подробнее чуть позже).

sem_ctime

Время последнего изменения структуры.

sem_base

Указатель на первый семафор в массиве.

sem_undo

Число запросов undo в массиве (подробнее чуть позже).

sem_nsems

Количество семафоров в массиве.

Структура ядра sem

В sem_ds есть указатель на базу массива семафоров. Каждый элемент массива имеет тип sem, который описан в linux/sem.h:


/* One semaphore structure for each semaphore in the system. */
struct sem {
  short   sempid;         /* pid of last operation */
  ushort  semval;         /* current value */
  ushort  semncnt;        /* num procs awaiting increase in semval */
  ushort  semzcnt;        /* num procs awaiting semval = 0 */
};

sem_pid

ID процесса, проделавшего последнюю операцию

sem_semval

Текущее значение семафора

sem_semncnt

Число процессов, ожидающих освобождения требуемых ресурсов

sem_semzcnt

Число процессов, ожидающих освобождения всех ресурсов

Системный вызов: semget()

Системный вызов semget() используется для того, чтобы создать новое множество семафоров или получить доступ к старому.


  SYSTEM CALL: semget();

  PROTOTYPE: int semget (key_t key, int nsems, int semflg);
    RETURNS: IPC-идентификатор множества семафоров в случае успеха
             -1 в случае ошибки
                errno: EACCESS (доступ отклонен)
                       EEXIST (существует нельзя создать (IPC_ESCL))
                       EIDRM (множество помечено как удаляемое)
                       ENOENT (множество не существует, не было исполнено
                               ни одного IPC_CREAT)
                       ENOMEM (не хватает памяти для новых семафоров)
                       ENOSPC (превышен лимит на количество множеств
                               семафоров)

Первый аргумент semget() это ключ (в нашем случае возвращается ftok()). Он сравнивается с ключами остальных множеств семафоров, присутствующих в системе. Вместе с этим решается вопрос о выборе между созданием и подключением к множеству семафоров в зависимости от аргумента msgflg.

IPC_CREAT

Создает множество семафоров, если его еще не было в системе.

IPC_EXCL

При использовании вместе с IPC_CREAT вызывает ошибку, если семафор уже существует.

Если IPC_CREAT используется в одиночку, то semget() возвращает идентификатор множества семафоров: вновь созданного или с таким же ключом. Если IPC_EXCL используется совместно с IPC_CREAT, то либо создается новое множество, либо, если оно уже существует, вызов приводит к ошибке и -1. Сам по себе IPC_EXCL бесполезен, но вместе с IPC_CREAT он дает средство гарантировать, что ни одно из существующих множеств семафоров не открыто для доступа.

Как и в других частях System V IPC, восьмеричный режим доступа может быть OR-нут в маску для формирования доступа к множеству семафоров.

Аргумент nems определяет число семафоров, которых требуется породить в новом множестве. Это количество принтеров в нашей комнате. Максимальное число семафоров определяется в "linux/sem.h":

  #define SEMMSL  32  /* <=512 max num of semaphores per id */

Заметьте, что аргумент nsems игнорируется, если Вы открываете существующее множество семафоров.

Напишем функции-переходники для открытия и создания множества семафоров:


int open_semaphore_set( key_t keyval, int numsems )
{
  int     sid;

  if (!numsems) return(-1);
  if ((sid = semget( mykey, numsems, IPC_CREAT | 0660 )) == -1)
  {
     return(-1);
  }
  return(sid);
}

Обратите внимание на явное задание доступа 0660. Эта незатейливая функция возвращает идентификатор множества семафоров (int) или -1 в случае ошибки. Должны быть также заданы значение ключа и число семафоров для того, чтобы сосчитать память, необходимую для них. В примере, завершающем этот IPC_EXCL используется для определения существует множество семафоров или нет.

Системный вызов: semop()


  SYSTEMCALL: semop();
  PROTOTYPE: int semop( int semid, struct sembuf *sops, unsigned nsops);
    RETURNS: 0 в случае успеха (все операции выполнены)
             -1 в случае ошибки
                errno: E2BIG (nsops больше чем максимальное число
                              позволенных операций)
                       EACCESS (доступ отклонен)
                       EAGAIN (при поднятом флаге IPC_NOWAIT операция не
                               может быть выполнена)
                       EFAULT (sops указывает на ошибочный адрес)
                       EIDRM (множество семафоров уничтожено)
                       EINTR (сигнал получен во время сна)
                       EINVAL (множество не существует или неверный semid)
                       ENOMEM (поднят флаг SEM_UNDO, но не хватает памяти
                               для создания необходимой undo-структуры)
                       ERANGE (значение семафора вышло за пределы
                               допустимых значений)

Первый аргумент semop() есть значение ключа (в нашем случае возвращается semget). Второй аргумент (sops), это указатель на массив операций, выполняемых над семафорами, третий аргумент (nsops) является количеством операций в этом массиве.

Аргумент sops указывает на массив типа sembuf. Эта структура описана в linux/sem.h следующим образом:


/* semop system call takes an array of these */
struct sembuf {
  ushort  sem_num;        /* semaphore index in array */
  short   sem_op;         /* semaphore operation */
  short   sem_flg;        /* operation flags */
};

sem_num

Номер семафора, с которым вы собираетесь иметь дело.

sem_op

Выполняемая операция (положительное, отрицательное число или нуль).

sem_flg

Флаги операции.

Если sem_op отрицателен, то его значение вычитается из семафора. Это соответствует получению ресурсов, которые контролирует семафор. Если IPC_NOWAIT не установлен, то вызывающий процесс засыпает, пока семафор не выдаст требуемое количество ресурсов (пока другой процесс не освободит их).

Если sem_op положителен, то его значение добавляется к семафору. Это соответствует возвращению ресурсов множеству семафоров приложения. Ресурсы всегда нужно возвращать множеству семафоров, если они больше не используются!

Наконец, если sem_op равен нулю, то вызывающий процесс будет усыплен (sleep()), пока значение семафора не станет нулем. Это соответствует ожиданию того, что ресурсы будут использованы на 100%. Хорошим примером был бы демон, запущенный с суперпользовательскими правами, динамически регулирующий размеры множества семафоров, если оно достигло стопроцентного использования.

Чтобы пояснить вызов semop, вспомним нашу комнату с принтерами. Пусть мы имеем только один принтер, способный выполнять только одно задание за раз. Мы создаем множество семафоров из одного семафора (только один принтер) и устанавливаем его начальное значение в 1 (только одно задание за раз).

Каждый раз, посылая задание на принтер, нам нужно сначала убедиться, что он свободен. Мы делаем это, пытаясь получить от семафора единицу ресурса. Давайте заполним массив sembuf, необходимый для выполнения операции:


  struct sembuf sem_lock = {0, -1, IPC_NOWAIT};

Трансляция вышеописанной инициализации структуры добавит -1 к семафору 0 из множества семафоров. Другими словами, одна единица ресурсов будет получена от конкретного (нулевого) семафора из нашего множества. IPC_NOWAIT установлен, поэтому либо вызов пройдет немедленно, либо будет провален, если принтер занят. Рассмотрим пример инициализации sembuf с помощью semop:


  if ((semop(sid, &sem_lock, 1) == -1) perror("semop");

Третий аргумент (nsops) говорит, что мы выполняем только одну (1) операцию (есть только одна структура sembuf в нашем массиве операций). Аргумент sid является IPC идентификатором для нашего множества семафоров.

Когда задание на принтере выполнится, мы должны вернуть ресурсы обратно множеству семафоров, чтобы принтером могли пользоваться другие.


  struct sembuf sem_unlock = {0, 1, IPC_NOWAIT};

Трансляция вышеописанной инициализации структуры добавляет 1 к семафору номер 0 множества семафоров. Другими словами, одна единица ресурсов будет возвращена множеству семафоров.

Системный вызов: semctl()


  SYSTEM CALL: semctl();
    PROTOTYPE: int semctl (int semid, int semnum, int cmd, union semun arg);
      RETURNS: натуральное число в случае успеха
               -1 в случае ошибки:
                  errno = EACCESS (доступ отклонен)
                          EFAULT (адрес, указанный аргументом arg, ошибочен)
                          EIDRM (множество семафоров удалено)
                          EINVAL (множество не существует или неправильный
                                  semid)
                          EPERM (EUID не имеет привилегий для cmd в arg)
                          ERANGE (значение семафора вышло за пределы
                                  допустимых значений)
        NOTES: Выполняет операции, управляющие множеством семафоров

Вызов semctl используется для осуществления управления множеством семафоров. Этот вызов аналогичен вызову msgctl для очередей сообщений. Если вы сравните списки аргументов этих двух вызовов, то заметите, что они немного отличаются. Напомним, что семафоры введены скорее как множества, чем как отдельные объекты. С операциями над семафорами требуется посылать не только IPC-ключ, но и конкретный семафор из множества.

Оба системных вызова используют аргумент cmd для определения команды, которая будет выполнена над IPC-объектом. Оставшаяся разница заключается в последнем аргументе. В msgctl он представляет копию внутренней структуры данных ядра. Повторим, что мы используем эту структуру для получения внутренней информации об очереди сообщений либо для установки или изменения прав доступа и владения очередью. Для семафоров поддерживаются дополнительные команды, которые требуют данных более сложного типа в последнем аргументе. Использование объединения (union) огорчает многих новичков до состояния %(. Мы очень внимательно разберем эту структуру, чтобы не возникало никакой путаницы.

Первый аргумент semctl() является ключом (в нашем случае возвращаемым вызовом semget). Второй аргумент (semun), это номер семафора, над которым совершается операция. По существу, он может быть понят как индекс на множестве семафоров, где первый семафор представлен нулем (0).

Аргумент cmd представляет собой команду, которая будет выполнена над множеством. Как вы можете заметить, здесь снова присутствуют IPC_STAT/IPC_SET вместе с кучей дополнительных команд, специфичных для множеств семафоров:

IPC_STAT

Берет структуру semid_ds для множества и запоминает ее по адресу аргумента buf в объединении semun.

IPC_SET

Устанавливает значение элемента ipc_perm структуры semid_ds для множества.

IPC_RMID

Удаляет множество из ядра.

GETALL

Используется для получения значений всех семафоров множества. Целые значения запоминаются в массиве элементов unsigned short, на который указывает член объединения array.

GETNCNT

Выдает число процессов, ожидающих ресурсов в данный момент.

GETPID

Возвращает PID процесса, выполнившего последний вызов semop.

GETVAL

Возвращает значение одного семафора из множества.

GETZCNT

Возвращает число процессов, ожидающих стопроцентного освобождения ресурса.

SETALL

Устанавливает значения семафоров множества, взятые из элемента array объединения.

SETVAL

Устанавливает значение конкретного семафора множества как элемент val объединения.

Аргумент arg вызова semсtl() является примером объединения semun, описанного в linux/sem.h следующим образом:


/* arg for semctl system calls. */
union semun {
  int val;                /* value for SETVAL */
  struct semid_ds *buf;   /* buffer for IPC_STAT & IPC_SET */
  ushort *array;          /* array for GETALL & SETALL */
  struct seminfo *__buf;  /* buffer for IPC_INFO */
  void *__pad;
};

val

Определяет значение, в которое устанавливается семафор командой SETVAL.

buf

Используется командами IPC_STAT/IPC_SET. Представляет копию внутренней структуры данных семафора, находящейся в ядре.

array

Указатель для команд GETALL/SETALL. Ссылается на массив целых, используемый для установки или получения всех значений семафоров в множестве.

Оставшиеся аргументы __buf и __pad предназначены для ядра и почти, а то и вовсе не нужны разработчику приложения. Эти два аргумента специфичны для LINUX, их нет в других UNIX-системах.

Поскольку этот особенный системный вызов наиболее сложен для восприятия среди всех системных вызовов System V IPC, мы рассмотрим несколько его примеров в действии.

Следующий отрывок выдает значение указанного семафора. Последний аргумент (объединение) игнорируется, если используется команда GETVAL.


int get_sem_val( int sid, int semnum )
{
  return( semctl(sid, semnum, GETVAL, 0));
}

Возвращаясь к примеру с принтерами, допустим, что потребовалось определить статус всех пяти принтеров:


#define MAX_PRINTERS 5

printer_usage()
{
  int x;

  for(x=0; x<MAX_PRINTERS; x++)
    printf("Printer %d: %d\n\r", x, get_sem_val( sid, x ));
}

C Рассмотрим следующую функцию, которая может быть использована для инициализации нового значения семафора:


void init_semaphore( int sid, int semnum, int initval)
{
  union semun semopts;

  semopts.val = initval;
  semctl( sid, semnum, SETVAL, semopts);
}

Заметьте, что последний аргумент semctl, это копия объединения, а не указатель на него. Рассмотрим довольно распространенную ошибку использования аргумента-объединения semctl().

Вспомним из описания msgtool, что команды IPC_STAT и IPC_SET изменяют информацию о доступе к очереди. Хотя эти же команды поддерживаются и для семафоров их употребление несколько отличается, поскольку внутренняя структура данных берется и копируется с элемента объединения, а не является отдельным объектом. Можете ли вы найти ошибку в следующем коде?


/* Required permissions should be passed in as text (ex: "660") */
void changemode(int sid, char *mode)
{
  int rc;
  struct semid_ds mysemds;

  /* Get current values for internal data structure */
  if ((rc = semctl(sid, 0, IPC_STAT, semopts)) == -1)
  {
     perror("semctl");
     exit(1);
  }
  printf("Old permissions were %o\n", semopts.buf->sem_perm.mode);
  /* Change the permissions on the semaphore */
  sscanf(mode, "%o", &semopts.buf->sem_perm.mode);
  /* Update the internal data structure */
  semctl(sid, 0, IPC_SET, semopts);
  printf("Updated...\n");
}

Программа пытается создать локальную копию внутренней структуры данных для множества семафоров, изменить права доступа и сIPC_SETить их обратно в ядро. Однако, первый вызов semctl немедленно вернет EFAULT или ошибочный адрес для последнего аргумента (объединения!). Кроме того, если бы мы не следили за ошибками для этого вызова, то заработали бы сбой памяти. Почему?

Вспомним, что команды IPC_SET/IPC_STAT используют элемент buf объединения, который является указателем на тип semid_ds. Указатели это указатели, и ничего кроме указателей! Элемент buf должен ссылаться на некий корректный участок памяти, чтобы наша функция работала как полагается. Рассмотрим исправленную версию:


void changemode(int sid, char *mode)
{
  int rc;
  struct semid_ds mysemds;

  /* Get current values for internal data structure */
  /* Point to our local copy first! */
  semopts.buf = &mysemds;
  /* Let's try this again! */
  if ((rc = semctl(sid, 0, IPC_STAT, semopts)) == -1)
  {
     perror("semctl");
     exit(1);
  }
  printf("Old permissions were %o\n", semopts.buf->sem_perm.mode);
  /* Change the permissions on the semaphore */
  sscanf(mode, "%o", &semopts.buf->sem_perm.mode);
  /* Update the internal data structure */
  semctl(sid, 0, IPC_SET, semopts);
  printf("Updated...\n");
}

semtool: интерактивное управление семафорами

Поведение semtool() зависит от аргументов командной строки, что удобно для вызова из скрипта shell. Позволяет делать все, что угодно, от создания и манипулирования до редактирования прав доступа и удаления множества семафоров. Может быть использовано для управления разделяемыми ресурсами через стандартные скрипты shell.

Синтаксис командной строки

Создание множества семафоров

semtool c (number of semaphores in set)

Блокировка семафора

semtool l (semaphore number to lock)

Разблокирование семафора

semtool u (semaphore number to unlock)

Изменение прав доступа

semtool m (mode)

Удаление множества семафоров

semtool d

Примеры


semtool  c 5
semtool  l
semtool  u
semtool  m 660
semtool  d

Источник


/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: semtool.c
 *****************************************************************************
 A command line tool for tinkering with SysV style Semaphore Sets

 *****************************************************************************/
#include <stdio.h>
#include <ctype.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

#define SEM_RESOURCE_MAX 1 /* Initial value of all semaphores */

void opensem(int *sid, key_t key);
void createsem(int *sid, key_t key, int members);
void locksem(int sid, int member);
void unlocksem(int sid, int member);
void removesem(int sid);
unsigned short get_member_count(int sid);
int getval(int sid, int member);
void dispval(int sid, int member);
void changemode(int sid, char *mode);
void usage(void);

int main(int argc, char *argv[])
{
  key_t key;
  int   semset_id;

  if (argc == 1) usage();
  /* Create unique key via call to ftok() */
  key = ftok(".", 's');
  switch(tolower(argv[1][0]))
  {
    case 'c': if (argc != 3) usage();
              createsem(&semset_id, key,  atoi(argv[2]));
              break;
    case 'l': if (argc != 3) usage();
              opensem(&semset_id, key);
              locksem(semset_id, atoi(argv[2]));
              break;
    case 'u': if (argc != 3) usage();
              opensem(&semset_id, key);
              unlocksem(semset_id, atoi(argv[2]));
              break;
    case 'd': opensem(&semset_id, key);
              removesem(semset_id);
              break;
    case 'm': opensem(&semset_id, key);
              changemode(semset_id, argv[2]);
              break;
    default: usage();
  }
  return(0);
}

void opensem(int *sid, key_t key)
{
  /* Open the semaphore set - do not create! */
  if ((*sid = semget(key, 0, 0666)) == -1)
  {
     printf("Semaphore set does not exist!\n");
     exit(1);
  }
}

void createsem(int *sid, key_t key, int members)
{
  int cntr;
  union semun semopts;

  if (members > SEMMSL)
  {
     printf("Sorry, max number of semaphores in a set is %d\n",
            SEMMSL);
     exit(1);
  }
  printf("Attempting to create new semaphore set with %d members\n",
         members);
  if ((*sid = semget(key, members, IPC_CREAT|IPC_EXCL|0666)) == -1)
  {
     fprintf(stderr, "Semaphore set already exists!\n");
     exit(1);
  }
  semopts.val = SEM_RESOURCE_MAX;
  /* Initialize all members (could be done with SETALL) */
  for(cntr=0; cntr<members; cntr++) semctl(*sid, cntr, SETVAL, semopts);
}

void locksem(int sid, int member)
{
  struct sembuf sem_lock={ 0, -1, IPC_NOWAIT};

  if (member<0 || member>(get_member_count(sid)-1))
  {
     fprintf(stderr, "semaphore member %d out of range\n", member);
     return;
  }
  /* Attempt to lock the semaphore set */
  if (!getval(sid, member))
  {
     fprintf(stderr, "Semaphore resources exhausted (no lock)!\n");
     exit(1);
  }
  sem_lock.sem_num = member;
  if ((semop(sid, &sem_lock, 1)) == -1)
  {
     fprintf(stderr, "Lock failed\n");
     exit(1);
  }
  else printf("Semaphore resources decremented by one (locked)\n");
  dispval(sid, member);
}

void unlocksem(int sid, int member)
{
  struct sembuf sem_unlock={ member, 1, IPC_NOWAIT};
  int semval;

  if (member<0 || member>(get_member_count(sid)-1))
  {
     fprintf(stderr, "semaphore member %d out of range\n", member);
     return;
  }
  /* Is the semaphore set locked? */
  semval = getval(sid, member);
  if (semval == SEM_RESOURCE_MAX)
  {
     fprintf(stderr, "Semaphore not locked!\n");
     exit(1);
  }
  sem_unlock.sem_num = member;
  /* Attempt to lock the semaphore set */
  if ((semop(sid, &sem_unlock, 1)) == -1)
  {
     fprintf(stderr, "Unlock failed\n");
     exit(1);
  }
  else printf("Semaphore resources incremented by one (unlocked)\n");
  dispval(sid, member);
}

void removesem(int sid)
{
  semctl(sid, 0, IPC_RMID, 0);
  printf("Semaphore removed\n");
}

unsigned short get_member_count(int sid)
{
  union semun semopts;
  struct semid_ds mysemds;

  semopts.buf = &mysemds;
  /* Return number of members in the semaphore set */
  return(semopts.buf->sem_nsems);
}

int getval(int sid, int member)
{
  int semval;

  semval = semctl(sid, member, GETVAL, 0);
  return(semval);
}

void changemode(int sid, char *mode)
{
  int rc;
  union semun semopts;
  struct semid_ds mysemds;

  /* Get current values for internal data structure */
  semopts.buf = &mysemds;
  rc = semctl(sid, 0, IPC_STAT, semopts);
  if (rc == -1)
  {
     perror("semctl");
     exit(1);
  }
  printf("Old permissions were %o\n", semopts.buf->sem_perm.mode);
  /* Change the permissions on the semaphore */
  sscanf(mode, "%ho", &semopts.buf->sem_perm.mode);
  /* Update the internal data structure */
  semctl(sid, 0, IPC_SET, semopts);
  printf("Updated...\n");
}

void dispval(int sid, int member)
{
  int semval;

  semval = semctl(sid, member, GETVAL, 0);
  printf("semval for member %d is %d\n", member, semval);
}

void usage(void)
{
  fprintf(stderr, "semtool - A utility for tinkering with semaphores\n");
  fprintf(stderr, "\nUSAGE:  semtool4 (c)reate <semcount>\n");
  fprintf(stderr, "                 (l)ock <sem #>\n");
  fprintf(stderr, "                 (u)nlock <sem #>\n");
  fprintf(stderr, "                 (d)elete\n");
  fprintf(stderr, "                 (m)ode <mode>\n");
  exit(1);
}

semstat: Программа-компаньон для semtool

В дополнение к semtool, приведем исходный текст программы-компаньона semstat. Она выводит на экран значение каждого из семафоров множества, созданного посредством semtool.


/*****************************************************************************
 Excerpt from "Linux Programmer's Guide - Chapter 6"
 (C)opyright 1994-1995, Scott Burkett
 *****************************************************************************
 MODULE: semstat.c
 *****************************************************************************
 A companion command line tool for the semtool package.  semstat displays
 the current value of all semaphores in the set created by semtool.
 *****************************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

int get_sem_count(int sid);
void show_sem_usage(int sid);
int get_sem_count(int sid);
void dispval(int sid);

int main(int argc, char *argv[])
{
  key_t key;
  int   semset_id;

  /* Create unique key via call to ftok() */
  key = ftok(".", 's');
  /* Open the semaphore set - do not create! */
  if ((semset_id = semget(key, 1, 0666)) == -1)
  {
     printf("Semaphore set does not exist\n");
     exit(1);
  }
  show_sem_usage(semset_id);
  return(0);
}

void show_sem_usage(int sid)
{
  int cntr=0, maxsems, semval;

  maxsems = get_sem_count(sid);
  while(cntr < maxsems)
  {
    semval = semctl(sid, cntr, GETVAL, 0);
    printf("Semaphore #%d:  --> %d\n", cntr, semval);
    cntr++;
  }
}

int get_sem_count(int sid)
{
  int rc;
  struct semid_ds mysemds;
  union semun semopts;

  /* Get current values for internal data structure */
  semopts.buf = &mysemds;
  if ((rc = semctl(sid, 0, IPC_STAT, semopts)) == -1) {
     perror("semctl");
     exit(1);
  }
  /* return number of semaphores in set */
  return(semopts.buf->sem_nsems);
}

void dispval(int sid)
{
  int semval;

  semval = semctl(sid, 0, GETVAL, 0);
  printf("semval is %d\n", semval);
}

6.4.4 Разделяемая память

Основные концепции

Разделяемая память может быть наилучшим образом описана как отображение участка (сегмента) памяти, которая будет разделена между более чем одним процессом. Это гораздо более быстрая форма IPC, потому что здесь нет никакого посредничества (т.е. каналов, очередей сообщений и т.п.). Вместо этого, информация отображается непосредственно из сегмента памяти в адресное пространство вызывающего процесса. Сегмент может быть создан одним процессом и впоследствии использован для чтения/записи любым количеством процессов.

Внутренние и пользовательские структуры данных

Давайте взглянем на структуру данных, поддерживаемую ядром, для разделяемых сегментов памяти.

Структура ядра shmid_ds

Так же, как для очередей сообщений и множеств семафоров, ядро поддерживает специальную внутреннюю структуру данных для каждого разделяемого сегмента памяти, который существует врутри его адресного пространства. Такая структура имеет тип shmid_ds и определена в linux/shm.h как следующая:


/* One shmid data structure for each shared memory segment in the system. */
struct shmid_ds {
  struct ipc_perm shm_perm;        /* operation perms */
  int     shm_segsz;               /* size of segment (bytes) */
  time_t  shm_atime;               /* last attach time */
  time_t  shm_dtime;               /* last detach time */
  time_t  shm_ctime;               /* last change time */
  unsigned short  shm_cpid;        /* pid of creator */
  unsigned short  shm_lpid;        /* pid of last operator */
  short   shm_nattch;              /* no. of current attaches */
                                   /* the following are private */
  unsigned short   shm_npages;     /* size of segment (pages) */
  unsigned long   *shm_pages;      /* array of ptrs to frames -> SHMMAX */
  struct vm_area_struct *attaches; /* descriptors for attaches */
};

Операции этой структуры исполняются посредством специального системного вызова и с ними не следует работать непосредственно. Вот описания полей, наиболее относящихся к делу:

shm_perm

Это образец структуры ipc_perm, который определен в linux/ipc.h. Он содержит информацию о доступе к сегменту, включая права доступа и информацию о создателе сегмента (uid и т.п.).

shm_segsz

Размеры сегмента (в байтах).

shm_atime

Время последней привязки к сегменту.

shm_dtime

Время последней отвязки процесса от сегмента.

shm_ctime

Время последнего изменения этой структуры (изменение mode и т.п.).

shm_cpid

PID создавшего процесса.

shm_lpid

PID последнего процесса обратившегося к сегменту.

shm_nattch

Число процессов, привязанных к сегменту на данный момент.

Системный вызов: shmget()

Чтобы создать новый разделяемый сегмент памяти или получить доступ к уже существующему, используется системный вызов shmget().


  SYSTEM CALL: shmget();
    PROTOTYPE: int shmget ( key_t key, int size, int shmflg );
      RETURNS: идентификатор разделяемого сегмента памяти в случае успеха
               -1 в случае ошибки:
                  errno = EINVAL (Ошибочно заданы размеры сегмента)
                          EEXIST (Сегмент существует, нельзя создать)
                          EIDRM (Сегмент отмечен для удаления, или был удален)
                          ENOENT (Сегмент не существует)
                          EACCESS (Доступ отклонен)
                          ENOMEM (Недостаточно памяти для создания сегмента)

Этот новый вызов должен выглядеть для вас почти как старые новости. Он поразительно похож на соответствующие вызовы get для очередей сообщений и множеств семафоров.

Первый аргумент для shmget() это значение ключа (в нашем случае возвращен посредством вызова ftok()). Это значение ключа затем сравнивается с существующими значениями, которые находятся внутри ядра для других разделяемых сегментов памяти. В этом отношении операция открытия или получения доступа зависит от содержания аргумента shmflg.

IPC_CREAT

Создает сегмент, если он еще не существует в ядре.

IPC_EXCL

При использовании совместно с IPC_CREAT приводит к ошибке, если сегмент уже существует.

Если используется один IPC_CREAT, то shmget() возвращает либо идентификатор для вновь созданного сегмента, либо идентификатор для сегмента, который уже существует с тем же значением ключа. Если вместе с IPC_CREAT используется IPC_EXCL, тогда либо создается новый сегмент, либо, если сегмент уже существует, вызов проваливается с -1. IPC_EXCL сам по себе бесполезен, но если он комбинируется с IPC_CREAT, то может быть использован как способ получения гарантии, что нет уже существующих сегментов, открытых для доступа.

Повторимся: необязательный восьмеричный доступ может быть объеденен по OR в маску доступа.

Давайте создадим функцию-переходник для обнаружения или создания разделяемого сегмента памяти:


int open_segment( key_t keyval, int segsize )
{
   int     shmid;

   if ((shmid = shmget( keyval, segsize, IPC_CREAT | 0660 )) == -1)
   {
      return(-1);
   }
   return(shmid);
}

Отметьте явное использование 0660 для прав доступа. Эта небольшая функция выдает либо идентификатор разделяемого сегмента памяти (int), либо -1 в случае ошибки. Значение ключа и заказанные размеры сегмента (в байтах) передаются в виде аргументов.

Как только процесс получает действующий идентификатор IPC для выделяемого сегмента, следующим шагом является привязка или размещение сегмента в адресном пространстве процесса.

Системный вызов: shmat()


  SYSTEM CALL: shmat();
    PROTOTYPE: int shmat (int shmid, char *shmaddr, int shmflg);
      RETURNS: адрес, по которому сегмент был привязан к процессу, в случае
               успеха
               -1 в случае ошибки:
                  errno = EINVAL (Ошибочно значение IPC ID или адрес
                                  привязки)
                          ENOMEM (Недостаточно памяти для привязки сегмента)
                          EACCES (Права отклонены)

Если аргумент addr является нулем, ядро пытается найти нераспределенную область. Это рекомендуемый метод. Адрес может быть указан, но типично это используется только для облегчения работы аппаратного обеспечения или для разрешения конфликтов с другими приложениями. Флаг SHM_RND может быть OR-нут в аргумент флага, чтобы заставить переданный адрес выровняться по странице (округление до ближайшей страницы).

Кроме того, если устанавливается флаг SHM_RDONLY, то разделяемый сегмент памяти будет распределен, но помечен readonly.

Этот вызов, пожалуй, наиболее прост в использовании. Рассмотрим функцию-переходник, которая по корректному идентификатору сегмента возвращает адрес привязки сегмента:


char *attach_segment( int shmid )
{
  return(shmat(shmid, 0, 0));
}

Если сегмент был правильно привязан, и процесс имеет указатель на начало сегмента, чтение и запись в сегмент становятся настолько же легкими, как манипуляции с указателями. Не потеряйте полученное значение указателя! Иначе у вас не будет способа найти базу (начало) сегмента.

Системный вызов: shmctl()


  SYSTEM SALL: shmctl();
    PROTOTYPE: int shmctl (int shmqid, int cmd, struct shmid_ds *buf);
      RETURNS: 0 в случае успеха
               -1 в случае ошибки:
                  errno = EACCESS (Нет прав на чтение при cmd, равном
                                   IPC_STAT)
                          EFAULT (Адрес, на который указывает буфер,
                                  ошибочен при cmd, равном IPC_SET или
                                  IPC_STAT)
                          EIDRM (Сегмент был удален во время вызова)
                          EINVAL (ошибочный shmqid)
                          EPERM (попытка выполнить команду IPC_SET или
                                 IPC_RMID но вызывающий процесс не имеет
                                 прав на запись, измените права доступа)

Вызов очень похож на msgctl(), выполняющий подобные задачи для очередей сообщений. Поэтому мы не будем слишком детально его обсуждать. Употребляемые значения команд следующие:

IPC_STAT

Берет структуру shmid_ds для сегмента и сохрает ее по адресу, указанному buf.

IPC_SET

Устанавливает значение ipc_perm-элемента структуры shmid_ds. Сами величины берет из аргумента buf.

IPC_RMID

Помечает сегмент для удаления.

Команда IPC_RMID в действительности не удаляет сегмент из ядра, а только помечает для удаления. Настоящее же удаление не происходит, пока последний процесс, привязанный к сегменту, не "отвяжется" от него как следует. Конечно, если ни один процесс не привязан к сегменту на данный момент, удаление осуществляется немедленно.

Снятие привязки производит системный вызов shmdt.

Системный вызов: shmdt()


  SYSTEM SALL: shmdt();
    PROTOTYPE: int shmdt (char *shmaddr);
      RETURNS: -1 в случае ошибки:
               errno = EINVAL (ошибочно указан адрес привязки)

После того, как разделяемый сегмент памяти больше не нужен процессу, он должен быть отсоединен вызовом shmdt(). Как уже отмечалось, это не то же самое, что удаление сегмента из ядра. После успешного отсоединения значение элемента shm_nattch структуры shmid_ds уменьшается на 1. Когда оно достигает 0, ядро физически удаляет сегмент.

shmtool: управление разделяемой памятью

Фон

Наш последний пример объектов System V IPC, shmtool: средство командной строки для создания, чтения, записи и удаления разделяемых сегментов памяти. Так же, как и в предыдущий примерах, во время исполнения любой операции сегмент создается, если его прежде не было.

Синтаксис командной строки

Запись строк в сегмент

shmtool w "text"

Получение строк из сегмента

shmtool r

Изменение режима доступа

shmtool m (mode)

Удаление сегмента

shmtool d

Примеры


shmtool  w   test
shmtool  w   "This is a test"
shmtool  r
shmtool  d
shmtool  m   660

Источник


#include <stdio.h>
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/shm.h>

#define SEGSIZE 100

main(int argc, char *argv[])
{
  key_t key;
  int   shmid, cntr;
  char  *segptr;

  if (argc == 1) usage();
  /* Create unique key via call to ftok() */
  key = ftok(".", 'S');
  /* Open the shared memory segment - create if necessary */
  if ((shmid = shmget(key, SEGSIZE, IPC_CREAT|IPC_EXCL|0666)) == -1)
  {
     printf("Shared memory segment exists - opening as client\n");
     /* Segment probably already exists - try as a client */
     if ((shmid = shmget(key, SEGSIZE, 0)) == -1)
     {
        perror("shmget");
        exit(1);
     }
  }
  else
  {
    printf("Creating new shared memory segment\n");
  }
  /* Attach (map) the shared memory segment into the current process */
  if ((segptr = shmat(shmid, 0, 0)) == -1)
  {
     perror("shmat");
     exit(1);
  }
  switch(tolower(argv[1][0]))
  {
    case 'w': writeshm(shmid, segptr, argv[2]);
              break;
    case 'r': readshm(shmid, segptr);
              break;
    case 'd': removeshm(shmid);
              break;
    case 'm': changemode(shmid, argv[2]);
              break;
    default: usage();
  }
}

writeshm(int shmid, char *segptr, char *text)
{
  strcpy(segptr, text);
  printf("Done...\n");
}

readshm(int shmid, char *segptr)
{
  printf("segptr: %s\n", segptr);
}

removeshm(int shmid)
{
  shmctl(shmid, IPC_RMID, 0);
  printf("Shared memory segment marked for deletion\n");
}

changemode(int shmid, char *mode)
{
  struct shmid_ds myshmds;

  /* Get current values for internal data structure */
  shmctl(shmid, IPC_STAT, &myshmds);
  /* Display old permissions */
  printf("Old permissions were: %o\n", myshmds.shm_perm.mode);
  /* Convert and load the mode */
  sscanf(mode, "%o", &myshmds.shm_perm.mode);
  /* Update the mode */
  shmctl(shmid, IPC_SET, &myshmds);
  printf("New permissions are : %o\n", myshmds.shm_perm.mode);
}

usage()
{
  fprintf(stderr, "shmtool - A utility for tinkering with shared memory\n");
  fprintf(stderr, "\nUSAGE:  shmtool (w)rite <text>\n");
  fprintf(stderr, "                (r)ead\n");
  fprintf(stderr, "                (d)elete\n");
  fprintf(stderr, "                (m)ode change <octal mode>\n");
  exit(1);
}


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 8 Символьная графика Оглавление: Оглавление Назад: 6 Межпроцессовые коммуникации LINUX

7 Программирование звука

ПК имеет как минимум одно звуковое устройство: встроенный динамик (PC speaker). Вы также можете купить звуковую карту для вашего ПК, обладающую большими звуковыми возможностями (см. Linux Sound User's Guide или Sound-HOWTO для поддерживаемых звуковых карт).

7.1 Программирование встроенного динамика

Встроенный динамик часть консоли Linux и, поэтому является символьным устройством. Как следствие, существуют запросы ioctl для манипуляций с ним:

  1. KDMKTONE

    Генерирует сигнал beep заданной длительности, используя таймер ядра.

    Пример: ioctl (fd, KDMKTONE,(long) argument).

  2. KIOCSOUND

    Генерирует бесконечный beep или прерывает звучащий в настоящий момент.

    Пример: ioctl(fd,KIOCSOUND,(int) tone).

Третий аргумент первого примера содержит значение тона в нижнем слове и сдвиг в верхнем. Тон это не частота. Таймер 8254 материнской платы ПК заведен на 1.19 МГц и поэтому тон = 1190000/частота. Сдвиг измеряется в шагах таймера. Оба вызова срабатывают немедленно, поэтому вы можете порождать звуковые сигналы, не блокируя программу.
KDMKTONE можно использовать для предупреждающих сигналов, поскольку вам не приходится заботиться о его прекращении.
При помощи KIOCSOUND можно проигрывать мелодии, как это демонстрируется в примере программы splay. Для остановки сигнала значение тона устанавливается в 0.

7.2 Программирование звуковой карты

Для вас как для программиста важно знать, что современные Linux-системы имеет встроенную звуковую карту. Один путь проверки: испытать /dev/sndstat. Если открытие /dev/sndstat закончилось неудачно и errno=ENODEV, то это означает, что ни один звуковой драйвер не активирован, и вы не получите никакой помощи от звукового драйвера ядра. Тот же результат может иметь попытка открыть /dev/dsp, если он не связан с драйвером pcsnd.

Если вы хотите повозиться со звуковыми картами на уровне железа, знайте, что комбинация вызовов outb() и inb() определит звуковую карту, которую вы ищете.

Программы, использующие звуковой драйвер, будут хорошо переноситься на другие i386 системы, поскольку некоторые умные люди решили использовать один драйвер для Linux, isc, FreeBSD и большинства других i386 архитектур. Звуковая карта уже не часть консоли Linux, а специальное устройство. Звуковая карта предлагает три основных возможности:

Каждая из возможностей имеет свой драйвер устройства. Для цифровых сэмплов это /dev/dsp, для модуляции частоты /dev/sequencer, для midi интерфейса /dev/midi. Звуковые установки (volume, balance, bass) контролируются через интерфейс /dev/mixer. В целях сравнения существует устройство /dev/audio, которое может читать звуковые данные SUN-law, но с преобразованием в сэмплы цифрового устройства.

Вы были правы, если подумали, что нужно использовать ioctl() для работы с этими устройствами. Запросы ioctl() определены в и начинаются с SNDCTL_.


Converted on:
Fri Mar 29 14:43:04 EST 1996

Вперед: 9 Программирование портов ввода/вывода Оглавление: Оглавление Назад: 7 Программирование звук а

 

8 Символьная графика

Эта глава имеет дело с вводом/выводом символов на экран. Когда мы говорим "символ", то подразумеваем композицию пикселов, которая может меняться в зависимости от таблицы представлений символов (charset). Ваша графическая карта уже предлагает одну или более таких таблиц и по умолчанию работает в текстовом (charset) режиме, потому что текст обрабатывается быстрее, чем пиксельная графика. Терминалы можно использовать лучше, чем как простые и скучные текстовые дисплеи. Рассмотрим, как использовать специальные возможности, которые предлагает терминал Linux, особенно консоль Linux.

В следующих разделах мы рассмотрим, как пользоваться различными пакетами доступа к терминалу. В Linux мы имеем GNU-версию termcap и можем пользоваться ncurses вместо curses.


8.1 Функции ввода/вывода в libc

8.1.1 Форматированный вывод

 

Функции printf(...) в libc обеспечивают форматированный вывод и позволяют трансформировать аргументы.

СимволФорматируется в
d,iint signed, десятиричный
oint unsigned, восьмеричный, без предваряющего 0
x,Xint unsigned, шестнадцатиричный, без предваряющего 0x
uint unsigned, десятиричный
cint (unsigned) одиночный символ
schar * до \0
fdouble как [-]mmm.ddd
e,Edouble как [-]m.dddddde+xx, [-]m.dddddde-xx
g,Gdouble использует %e или %f когда нужно
pvoid *
nint *
%%

  
Таблица 8.1: Libc: трансформации printf

8.1.2 Форматированный ввод

 

Точно так же, как printf(...) для форматированного вывода, Вы можете использовать scanf(...) для форматированного ввода.

СимволВход: тип аргумента dдесятичный integer: int* iinteger: int* (вход может быть восьми или шестнадцатиричным) oвосьмеричный integer: int* (с или без предваряющего 0) uдесятичный unsigned: unsigned int* xшестнадцатиричный integer: int* (с или без предваряющего 0x) cодин или более символов: char* (без завершающего /0) e,f,gffloat: float* (такой как [-]m.dddddde+xx, [-]m.dddddde-xx) pуказатель: void* nчисло трансформированных аргументов: int* [...]непустое множество символов на входе: char* [^...]исключая такие символы: char* %%

  
Таблица 8.2: Libc: правила scanf
перед d,i,n,o,u,x может стоять h, если указатель short
то же для l, если указатель long
l также может быть перед e,f,g, если указатель double
L может стоять перед e,f,g, если указатель long double

8.2 Библиотека termcap

8.2.1 Введение

Библиотека termcap это API для базы данных termcap, которая находится в /etc/termcap. Библиотечные функции позволяют:

Программы, использующие библиотеку termcap должны включать termcap.h и собираться с:

gcc [flags] files -ltermcap

Функции termcap терминально-независимые программы, но дают программисту только низкоуровневый доступ к терминалу. Для пакета более высокого уровня потребуется curses или ncurses.

8.2.2 Поиск описания терминала

8.2.3 Описание терминала

Каждый фрагмент информации называется свойством (capability). Каждое свойство это двухсимвольный код, за каждым двухсимвольным кодом стоит значение свойства. Возможны следующие типы свойств:

Каждое свойство связано с единственным типом значений (co всегда числовой, hc всегда флаг, а st всегда строка). Три типа значений и три типа функций, их запрашивающих. char *name двухсимвольный код свойства.

8.2.4 Свойства termcap

Boolean

5iпринтер не имеет эха на экране
amавтоматические границы, что означает автоматическое форматирование строки
bsCrtl-H представляет backspace
bwbackspace на левой границе переносит строку на правую границу предыдущей
daвывести сохраненное над текущим экраном
dbвывести сохраненное под текущим экраном
eoпробел стирает литеру на позиции курсора
esesc-последовательности и специальные символы работают в строке состояния
gnродовое устройство
hcэто терминал твердой копии (hardcopy terminal)
HCкурсор плохо видно, когда он не на последней линии
hsприсутствует линия статуса
hzтерминал не может напечатать тильды (tilde characters)
inтерминал вставляет нули вместо пробелов на пустые места
kmтерминал имеет мета клавишу
miрежим вставки для курсора
msрежим стандартного вывода/подчеркивания для курсора
NPнет символов-заполнителей
NRti не обращает teos, терминал может забивать ошибки
ulтерминал подчеркивает, но ошибки забивать не может
xbсбой, вызванный столпотворением, F1 посылает ESCAPE, F2 посылает ^C
xnсбой новой строки/соединения строк
xoтерминал использует xon/xoff протокол
xsтекст, напечатанный поверх выделенного, будет выделен
xtсбой телевизионного луча, неверная табуляция и странный режим выделения

Numeric

coчисло столбцов
dBприостановка на милисекунды для возврата на терминалах твердой копии
dCприостановка на милисекунды для перевода каретки на терминалах твердой копии
dFприостановка на милисекунды для заполнения страницы на терминалах твердой копии
dNприостановка на милисекунды для новой линии на терминалах твердой копии
dTприостановка на милисекунды для табуляции на терминалах твердой копии
dVприостановка на милисекунды для вертикальной табуляции на терминалах твердой копии
itраница между позициями табуляции
lhвысота мягких меток
lmлинии памяти
lwширина
liчисло линий
Nlчисло мягких меток
pbнаименьшая граница, когда требуется дозаполнение
sgсбой режима выделения
ugсбой режима подчеркивания
vtномер виртуального терминала
wsширина линии статуса, если она отлична от ширины экрана

String

!1клавиша сохранения в верхнем регистре
!2клавиша подвешивания в верхнем регистре
!3клавиша undo в верхнем регистре
#1клавиша помощи в верхнем регистре
#2клавиша home в верхнем регистре
#3клавиша ввода в верхнем регистре
#4клавиша курсор влево в верхнем регистре
%0клавиша redo
%1клавиша помощи
%2клавиша пометки
%3клавиша сообщения
%4клавиша перемещения
%5клавиша следующего объекта
%6клавиша открытия
%7клавиша опций
%8клавиша предыдущего объекта
%9клавиша печати
%aклавиша сообщения в верхнем регистре
%bклавиша перемещения в верхнем регистре
%cклавиша следующего объекта в верхнем регистре
%dклавиша опций в верхнем регистре
%eклавиша предыдущего объекта в верхнем регистре
%fклавиша печати в верхнем регистре
%gклавиша redo в верхнем регистре
%hклавиша перестановки в верхнем регистре
%iклавиша курсор-вправо в верхнем регистре
%jклавиша продолжения в верхнем регистре
&0клавиша cancel в верхнем регистре
&1клавиша ссылки
&2клавиша обновления
&3клавиша перестановки
&4клавиша перезапуска
&5клавиша продолжения
&6клавиша сохранения
&7клавиша подвешивания
&8клавиша undo
&9клавиша начала в верхнем регистре
*0клавиша поиска в верхнем регистре
*1клавиша команды в верхнем регистре
*2клавиша копирования в верхнем регистре
*3клавиша создания в верхнем регистре
*4клавиша удаления символа в верхнем регистре
*5клавиша удаления строки в верхнем регистре
*6клавиша выделения
*7клавиша конца в верхнем регистре
*8клавиша очистки линии в верхнем регистре
*9клавиша выхода в верхнем регистре
0клавиша поиска1 клавиша начала
2клавиша cancel
3клавиша закрытия
4клавиша команды
5клавиша копирования
6клавиша создания
7клавиша конца
8клавиша ввода/посылки
9клавиша выхода
alклавиша вставки одной линии
ALклавиша вставки %1 линий
acцвет блока символов, отображаемых в другой таблице символов
aeконец множества символов из альтернативной таблицы
asначало блока символов в альтернативной таблице
bcbackspace, если не ^H
blсимвол звонка
btпереход к предыдущему месту табуляции
cbочистка от начала линии до курсора
ccстранный командный символ
cdочистка до конца экрана
ceочистка до конца линии
chперемещение курсора горизонтально до столбца %1
clочистка экрана, курсор помещается в начало
cmкурсор перемещается на строку %1 и колонку %2 (на экране)
CMкурсор перемещается на строку %1 и колонку %2 (в памяти)
crвозврат каретки
csобласть прокрутки от строки %1 до строки %2
ctочистка табуляций
cvвертикальное движение курсора до строки %1
dcудаление 1 символа
DCудаление %1 символов
dlудаление 1 строки
DLудаление %1 строк
dmначало режима удаления
doкурсор на 1 линию вниз
DOкурсор на %1 линию вниз
dsубрать строку статуса
eAактивирование альтернативной символьной таблицы
ecудаление %1 символов начиная с позиции курсора
edконец режима удаления
eiконец режима вставки
ffсимвол дозаполнения экрана на терминалах твердой копии
fsвозврат символа на его позицию перед переходом на строку статуса
F1строка послана функциональной клавишей F11
... ...
F9строка послана функциональной клавишей F19
FAстрока послана функциональной клавишей F20
... ...
FZстрока послана функциональной клавишей F45
Faстрока послана функциональной клавишей F46
... ...
Frстрока послана функциональной клавишей F63
hdперемещение курсора на пол-линии вниз
hoкурсор в начало
huперемещение курсора на пол-линии вверх
i1инициализация строки 1 в начале сеанса
i3инициализация строки 3 в начале сеанса
isинициализация строки 2 в начале сеанса
icвставка 1 символа
ICвставка %1 символов
ifфайл инициализации
imначало режима вставки
ipвставка времени и необходимых специальных символов после вставки
iPпрограмма инициализации
K1верхняя левая клавиша на keypad
K2центральная клавиша на keypad
K3верхняя правая клавиша на keypad
K4нижняя левая клавиша на keypad
K5нижняя правая клавиша на keypad
k0функциональная клавиша 0
... ...
k9функциональная клавиша 9
k;функциональная клавиша 10
kaклавиша очистки всех табуляций
kAклавиша вставки линии
kbклавиша backspace
kBклавиша возврата к предыдущему месту табуляции
kCклавиша очистки экрана
kdклавиша down
kDклавиша удаления символа под курсором
keотключение keypad
kEклавиша очистки до конца строки
khклавиша курсор home
kHклавиша курсор home+down
kIвставка символа/клавиша режима вставки
klклавиша курсор left
kLклавиша удаления строки
kMMклавиша выхода из режима вставки
kNклавиша следующей страницы
kPклавиша предыдущей страницы
krклавиша курсор right
kRклавиша прокрутки назад/вверх
ksвключение keypad
kSклавиша очистки до конца экрана
ktклавиша очистки данной табуляции
kTклавиша установки табуляции на этом месте
kuклавиша курсор up
l0метка для нулевой функциональной клавиши, если не f0
l1метка для первой функциональной клавиши, если не f1
l2метка для второй функциональной клавиши, если не f2
...
laметка для десятой функциональной клавиши, если не f10
leкурсор влево на 1 символ
llперемещение курсора в нижний левый угол
LEкурсор влево на %1 символов
LFотключение мягких меток
LOвключение мягких меток
mbначало мерцания
MCочистка мягких границ
mdначало режима верхнего регистра
meконец всех режимов типа so, us, mb, md, mr
mhначало полуяркого режима
mkначало темного режима (символы не видны)
MLустановка левой мягкой границы
mmвход терминала в метарежим
moвыход терминала из метарежима
mpвключение защищенного атрибута
mrначало режима обращения (reverse mode)
MRустановка правой мягкой границы
ndкурсор на 1 символ влево
nwкоманда возврата каретки
pcсимвол-заполнитель
pfотключение принтера
pkпрограммная клавиша %1 для посылки строки %2, если нажата пользователем
plпрограммная клавиша %1 для исполнения строки %2 в локальном режиме
pnпрограммная мягкая метка %1 для отображения строки %2
poподключение принтера
pOподключение принтера для %1 (<256) байт
psпечать содержимого экрана на принтере
pxпрограммная клавиша %1 для посылки строки %2 в компьютер
r1сброс строки 1, установка нормальных режимов
r2сброс строки 2, установка нормальных режимов
r3сброс строки 3, установка нормальных режимов
RAотключение автоматических границ
rcвосстановление сохраненной позиции курсора
rfсброс строки имени файла
RFтребование ввода с терминала
RIкурсор вправо на %1 символов
rpповторение символа %1 %2 раз
rPзаполнение после присланного символа в режиме замены
rsсброс строки
RXвыключение XON/XOFF управления
saустановка атрибутов %1 %2 %3 %4 %5 %6 %7 %8 %9
SAвключение автоматических границ
scсохранение позиции курсора
seконец режима стандартного вывода
sfнормальная прокрутка на одну строку
SFнормальная прокрутка на %1 строк
soначало режима стандартного вывода
srобратная прокрутка
SRпрокрутка назад на %1 строк
stустановка табуляции во всех строках в данной колонке
SXвключение XON/XOFF управления
taперемещение к следующей табуляции физического устройства
tcчтение в описании терминала с другой точки входа
teконец программы, использующей движение курсора
tiначало программы, использующей движение курсора
tsперемещение курсора на столбец %1 строки статуса
ucподчеркивание символа под курсором и движение курсора вправо
ueконец подчеркивания
upкурсор на 1 строку вверх
UPкурсор на %1 строк вверх
usначало подчеркивания
vbвидимый звонок
veнормальный видимый курсор
viневидимый курсор
vsкурсор стандартного вывода
wiустановка окна со строки %1 до строки %2 и столбцов с %3 до %4
XFсимвол XOFF, если не ^S

8.3 Введение в ncurses

В этом разделе будем пользоваться следующей терминологией:

Обычно программа, использующая ncurses, выглядит так:

#include 
...
main()
{
   ...
   initscr();
   /* вызов функции ncurses */
   endwin();
   ...
}

Подключение ncurses.h определит переменные и типы для ncurses, такие как WINDOW, и прототипы функций. Автоматически подключатся stdio.h, stdarg.h, termios.h и unctrl.h.

initscr() используется для инициализации структур данных ncurses и для чтения файла terminfo. Будет захвачена память под stdscr и curscr. Если произойдет ошибка, то initscr вернет ERR. В противном случае возвращается указатель на stdscr. Кроме этого, экран будет очищен и будут проинициализированы LINES и COLS.

endwin() очистит все выделенные ресурсы ncurses и восстановит режимы tty, какими они были до вызова initscr(). Функция endwin() должна вызываться перед любой другой функцией из библиотеки ncurses и перед выходом из вашей программы. Если вы хотите использовать для вывода более чем один терминал, используйте newterm(...) вместо initscr().

Компилируйте программу посредством:

gcc [flags] files -lncurses

Вы можете устанавливать любые флаги (см. gcc(1)). Если путь к ncurses.h изменился, вы должны включить следующую строку, иначе ncurses.h, nterm.h, termcap.h и unctrl.h не будут найдены:

-I/usr/include/ncurses

Другие возможные в Linux флаги: O2 скажет gcc произвести некоторую оптимизацию; -ansi: для ANSI си-кода; -Wall выведет все предупреждения; -m486 оптимизирует код для Intel 486 (можно и для Intel 386).

Библиотека ncurses находится в /usr/lib. Существует 3 версии библиотеки:

Структуры данных для экрана называются windows и определены в ncurses.h. Окно это нечто типа символьного массива в памяти, которым программист может манипулировать без вывода на терминал. При помощи newwin(...) вы можете создать другие окна.

Чтобы оптимально обновить физический терминал, ncurses имеет другое окно, curscr. Это изображение, реально выводимое на экран. Для отображения stdscr на экране используется функция refresh(). После этого ncurses обновит curscr и физический терминал содержимым stdscr. Библиотечные функции произведут внутреннюю оптимизацию для процесса обновления, поэтому вы можете менять различные окна и затем обновлять экран сразу самым оптимальным способом.

Функциями ncurses вы можете работать со структурой данных window. Функции, начинающиеся с w, позволяют назначать окно window, тогда как остальные обычно имеют дело с stdscr. Функции, начинающиеся с mv, прежде всего переместят курсор на позицию y,x.

Символы имеют тип chtype, который является long unsigned int , чтобы сохранять дополнительную информацию о себе (атрибуты и т.д.).

Библиотека ncurses использует базу данных terminfo. Обычно она находится в usr/lib/terminfo/, и ncurses обращается туда за локальными определениями терминала. Если вы хотите проверить некоторые другие определения для терминала, не исправляя первоначальную terminfo, установите соответственно переменную среды TERMINFO. Эта переменная будет протестирована ncurses, и вместо usr/lib/terminfo/ сохранятся ваши определения.

Текущей версией ncurses является (на момент написания книги) 1.8.6.

В конце этого раздела вы найдете обзорную таблицу для BSD-Curses, ncurses и Sun-OS 5.4 curses.

8.4 Инициализация

8.5 Окна

Окна могут быть созданы, уничтожены, перемещены, скопированы, задублированы и т.д.

8.6 Вывод

8.6.1 Форматированный вывод

8.6.2 Вставка символов и строк

8.6.3 Удаление символов и строк

8.6.4 Боксы и линии

8.6.5 Фоновый (background) символ

Код символаПозиция По умолчанию
tlлевая верхняяACS_ULCORNER
tsверхняя сторонаACS_HLINE
trправая верхняяACS_URCORNER
lsлевая сторонаACS_VLINE
rsправая сторонаACS_VLINE
blлевая нижняяACS_LLCORNER
bsнижняя сторонаACS_HLINE
brправая нижняяACS_LRCORNER
rtправая средняяACS_RTEE
ltлевая средняяACS_LTEE
ttверхняя средняяACS_TTEE
btнижняя средняяACS_BTEE

  
Таблица 8.3: Ограничительные символы Ncurses

Рисунок 8.2: Символы бокса в ncurses.

tl      ts    tt     ts      tr
  |------------|------------|
  |                         |
ls|            |            |rs
  |                         |
  |            |            |
lt|- - - - - - - - - - - - -|rt
  |            |            |
  |                         |
ls|            |            |rs
  |                         |
  |------------|------------|
bl      bs    bt     bs      br

8.7 Ввод

8.7.1 Форматированный ввод

8.8 Опции

Опции вывода

8.8.1 Опции ввода

8.8.2 Атрибуты терминала

8.8.3 Использование опций

Поговорим об использовании опций окна и режимов терминала.

Прежде всего, под Linux следует подключить keypad. Это позволит пользоваться цифровым блоком и клавишами перемещения курсора на клавиатуре ПК.

Теперь имеется 2 основных типа ввода:

  1. Программа ожидает нажатия клавиши, чтобы вызвать соответствующую функцию (например, что-нибудь вроде "press 'q' for quit" и ждет q);
  2. Ожидается, что пользователь введет строку символов в маску на экране (например, каталог или адрес в базе данных).

Для первого случая мы установим следующие опции и режимы, и цикл while сработает корректно:

char c;

noecho();
timeout(-1);
nonl();
cbreak();
keypad(stdscr,TRUE);
while(c=getch()){
  switch(c){
    case 'q': your_quit_function();
    default: break;
  }
}

Эта программа повиснет до нажатия клавиши. Если нажата q, мы вызываем your_quit_function(), иначе ждем другого ввода.

Выражение switch может быть расширено по нашему желанию. Макросы KEY_* служат для учета специальных клавиш. Например,

KEY_UP     KEY_RIGHT   KEY_A1   KEY_B2   KEY_C1
KEY_DOWN   KEY_LEFT    KEY_A3            KEY_C3
для клавиш перемещения курсора. Для просмотра файла цикл может выглядеть примерно так:
int loop=TRUE;
char c;
enum{UP,DOWN,RIGHT,LEFT};

noecho();
timeout(-1);
nonl();
cbreak();
keypad(stdscr,TRUE);
while(loop==TRUE){
   c=getch();
   switch(c){
      case KEY_UP:
      case 'u':
      case 'U': scroll_s(UP);
                break;
      case KEY_DOWN:
      case 'd':
      case 'D': scroll_s(DOWN);
                break;
      case KEY_LEFT:
      case 'l':
      case 'L': scroll_s(LEFT);
                break;
      case KEY_RIGHT:
      case 'r':
      case 'R': scroll_s(RIGHT);
                break;
      case 'q':
      case 'Q': loop=FALSE;
      default: break;
   }
}

Для второго случая, нам достаточно установить echo(), и символы, набираемые пользователем, будут напечатаны на экране. Место печати задается функциями move(...) или wmove(...).

Или вы можете открыть окно с маской (выделяемой другими цветами) и попросить пользователя ввести строку:

WINDOW *maskwin;
WINDOW *mainwin;
char *ptr=(char *)malloc(255);
...
   mainwin=newwin(3,37,9,21);
   maskwin=newwin(1,21,10,35);
   ...
   werase(mainwin);
   werase(maskwin);
   ...
   box(mainwin,0,0)
   mvwaddstr(mainwin,1,2,"Inputstring:");
   ...
   wnoutrefresh(mainwin);
   wnoutrefresh(maskwin);
   doupdate();
   ...
   mvwgetstr(maskwin,0,0,ptr);
   ...
   delwin(maskwin);
   delwin(mainwin);
   endwin();
   free(ptr);

Более подробно см. input.c в каталоге примеров.

8.9 Очистка окна и линий

8.10 Обновление терминала

Как написано в обзоре, окна ncurses есть отображения в памяти. Это означает, что любое изменение окна не отражается на физическом экране до тех пор, пока не будет произведено обновление. Это оптимизирует вывод на экран, поскольку вы получаете возможность совершать множество действий, а затем лишь единожды вызвать обновление, чтобы напечатать его на экране. В противном случае на терминале отражалось бы каждое изменение, что ухудшало бы исполнение ваших программ.

8.11 Видеоатрибуты и цвет

Атрибуты это специальные возможности терминала, применяемые во время печати символов на экран. Символы могут быть напечататы жирно, могут быть подчеркнуты, могут мигать и т.д. В ncurses вы имеете возможность включать или отключать атрибуты для достижения наилучшего внешнего вида вывода. Возможные атрибуты перечислены в нижеследующей таблице.

ОпределениеАтрибут
A_ATTRIBUTESмаска для атрибутов (chtype)
A_NORMALнормальный, переустановка всего остального
A_STANDOUTнаиболее яркий режим
A_UNDERLINEподчеркивание
A_REVERSEобратное изображение
A_BLINKмигание
A_DIMтусклый или полуяркий режим
A_BOLDчеткий или очень яркий режим
A_ALTCHARSETиспользование альтернативной символьной таблицы
A_INVISневидимый режим
A_PROTECTне понял
A_CHARTEXTмаска для действующих символов (chtype)
A_COLORмаска для цвета
COLOR_PAIR(n)установка цветовой пары n
PAIR_NUMBER(a)получение цветовой пары, лежащей в атрибуте a

  
Таблица 8.4: Ncurses-атрибуты

Ncurses определяет 8 цветов, которыми вы можете пользоваться на терминале с цветовой поддержкой. Сначала проинициализируйте цветовые структуры данных посредством start_color(), затем проверьте возможности терминала при помощи has_colors(). start_color() будет инициализировать COLORS, наибольшее количество цветов, поддерживаемых терминалом, и COLOR_PAIR, максимальное число цветовых пар, которые вы можете определить.

ОпределениеЦвет
COLOR_BLACKчерный
COLOR_REDкрасный
COLOR_GREENзеленый
COLOR_YELLOWжелтый
COLOR_BLUEсиний
COLOR_MAGENTAпурпурный
COLOR_CYANголубой
COLOR_WHITEбелый

  
Таблица 8.5: Цвета в Ncurses

Атрибуты могут быть совмещены '|' (OR), поэтому вы можете получить четкий мерцающий вывод при помощи A_BOLD|A_BLINK

Если вы установите окно с атрибутом attr, все символы, напечатанные в этом окне, приобретут это свойство и будут его сохранять до изменения вами атрибута. Это не будет утеряно при прокрутке или движении окна и т.п.

Будьте осторожны с цветами, если вы пишете программы для ncurses и BSD curses, так как BSD curses не имеет цветовой поддержки. (Точно так же не имеют цветовой поддержки старые версии SYS V). Поэтому, если вы компилируете для обеих библиотек, придется использовать операции #ifdef.

Как комбинировать атрибуты и цвета? Некоторые терминалы, как консоли в Linux, имеют цвета, а некоторые нет (xterm, vs100 и т.д.). Следующий код решит эту проблему:

void CheckColor(WINDOW *win1, WINDOW *win2)
{
  start_color();
  if (has_colors()){
     /* Хорошо, у нас есть цвета, определяем цветовые пары для
      * цветов переднего и заднего плана
      */
     init_pair(1,COLOR_BLUE,COLOR_WHITE);
     init_pair(2,COLOR_WHITE,COLOR_RED);
     /* теперь используем уже определенные цветовые пары для окон */
     wattrset(win1,COLOR_PAIR(2));
     wattrset(win2,COLOR_PAIR(1));
  }
else
  {
    /* Нет цвета (может быть vt100 или xterm). Ладно, будем
     * пользоваться вместо этого черно-белыми атрибутами.
     */
    wattrset(win1,A_REVERSE);
    wattrset(win2,A_BOLD);
  }
  return;
}

Прежде всего, функция CheckColor проинициализирует цвета при помощи start_color(). Затем has_colors() вернет TRUE, если текущий терминал имеет цвета. После этого вызывается ini_tpair(...) для соединения цветов переднего и заднего плана, и wattrset(...) для установки этих цветов в данном окне. Впрочем, чтобы установить атрибуты для черно-белого терминала, мы можем использовать только wattrset(...).

Чтобы получить цвета на xterm, лучший способ, найденный автором, это использовать ansi_xterm с надерганными элементами terminfo из Midnight Commander. Просто добудьте исходники ansi_xterm и Midnight Commander (mc-x.x.tar.gz). Потом скомпилируйте ansi_xterm и используйте tic с xterm.ti и vt100.ti из архива mc-x.x.tar.gz. Запустите ansi_xterm и протестируйте его.

8.12 Координаты курсора и окна