Файл: что такое, его имя, свойства, формат, части. Информатика
Содержание:
Статья ознакомит с понятием файловой системы (ФС), файла в среде Windows, их свойствами и характеристиками. Кратко рассмотрим принципы хранения, адресации информации на компьютере, разберёмся, из чего состоит имя файла (документа), с правилами написания их имён.
Файловая система в информатике: что это
Для хранения информации на накопителе его необходимо отформатировать – сформировать файловую систему – это в информатике порядок, методика организации хранения данных на цифровых носителях. От неё зависит формат файлов, их атрибуты, способ записи на накопитель, порядок обращения, свойства, возможности (работа с архивными версиями, разделение прав доступа).
На устройствах с ОС Windows наиболее распространены ФС FAT32 (старая) и NTFS.
Что такое файл, путь к нему
Данные на цифровых носителях хранятся в виде документов – это адресуемая область памяти на накопителе, единица, базовый объект при работе программного обеспечения с данными. В графическом интерфейсе (Проводнике) выглядит как объект с именем и разрешением. Разберёмся, из каких двух частей состоит имя файла.
Физически файл – это контейнер, внутри которого определённым образом сосредоточена информация. Способ её размещения, позволяющий считывать и записывать данные внутрь контейнера называется форматом. Программы и ОС для работы с данными обращаются к файлам как элементарным единицам цифрового объекта. Информацию об адресах ячеек, последовательности обращения к ним для считывания содержимого контейнера им сообщает драйвер ФС.
В ОС UNIX документами являются даже порты и периферийные устройства.
Имена и адреса
В операционных системах Windows полное имя файла любого типа (графического, исполняемого, мультимедийного) состоит из нескольких частей. Например, C:\Windows\system32\calc.exe:
Имена документам дают приложения, в которых они создаются, или пользователи. Для экономии дискового пространства и трафика во время передачи по сети файлы архивируют – сжимают. Видео, установщики, аудио, многие графические документы сжаты по умолчанию, текстовые (txt, docx) и несжатые типы (bmp, aiff, wav, raw – исходники фото с цифровых камер) архивируются лучше всего.
Расширение – не обязательная часть документа. Оно служит для идентификации объектов пользователем, операционной системой и программами, указывает на формат файла. ОС устанавливает взаимосвязь, ассоциацию между разрешением и приложениями. При открытии пользователем документа он автоматически загружается в привязанную к разрешению программу. Если это file.docx – открывается через Word, mp3 – загрузится в аудиоплеер, а mp4 – воспроизводит мультимедийный проигрыватель.
Если объект хранится в сети, перед его полным путём указывают:
В одной директории не могут размещаться два объекта с одинаковыми именами и расширениями. В распространённых в Windows ФС строчные и заглавные буквы идентичны: File.avi, FILE.mp3 и file.mp3 – одно имя.
Длина участков имени (названия каждого каталога в пути) для NTFS ограничена 255 символами, общая длина пути – 32 000 знаками. Файл с названием длиной 255 символов может храниться в 124 подкаталогах с максимальной длиной наименования.
В имени допустимо использование символов Unicode за исключением ряда специальных знаков: двойной кавычки, черты и косой черты, вертикальной линии, вопросительного знака, звёздочки, двоеточия, знаков «больше» и «меньше».
Для документов в Windows предусмотрены атрибуты – метаданные, дополнительная информация, описывающая их. В Windows предусмотрено четыре атрибута со значением «Активно» либо «Отключено». Это:
Устанавливаются и снимаются атрибуты в свойствах документа (вызываются правой клавишей мыши).
Тесты
Определите, какие из файлов сжимаются лучше всего:
Имя файла. Имя файла состоит из двух частей, разделенных точкой: собственно имя файла и расширение, определяющее его тип (программа, данные и так далее). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.
В различных операционных системах существуют различные форматы имен файлов. В операционной системе MS-DOS собственно имя файла должно содержать не более 8 букв латинского алфавита, цифр и некоторых специальных знаков, а расширение состоит из трех латинских букв, например: proba.txt
В операционной системе Windows имя файла может иметь длину до 255 символов, причем можно использовать русский алфавит, например: Единицы измерения информации.doc
Таблица 1.1. Типы файлов и расширений
Программы на языках программирования
Таблица 1.2. Одноуровневый каталог
Имя файла
Номер начального сектора
Файл_1
56
Файл_2
89
Файл_112
1200
Начальный, корневой каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из последних может содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.
Файловая система— это система хранения файлов и организации каталогов.
Рис. 1.3. Иерархическая файловая система
Рис. 1.4. Пример иерархической файловой системы
Путь к файлу вместе с именем файла называют иногда полным именем файла.
Пример полного имени файла:
Однако иерархическая структура этих систем несколько различается. В иерархической файловой системе MS-DOS вершиной иерархии объектов является корневой каталог диска, который можно сравнить со стволом дерева, на котором растут ветки (подкаталоги), а на ветках располагаются листья (файлы).
Рис. 1.5. Иерархическая структура папок
Если мы хотим ознакомиться с ресурсами компьютера, необходимо открыть папку Мой компьютер.
1. В окне Мой компьютер находятся значки имеющихся в компьютере дисков. Активизация (щелчок) значка любого диска выводит в левой части окна информацию о его емкости, занятой и свободной частях.
Информация на носителях данных (жестких, оптических дисках, дискетах) хранится в файлах. Строгое определение файла звучит так: «файл — это поименованная область на диске». Разберемся, что здесь к чему. При форматировании жесткого диска производится его разметка на дорожки и секторы. Файловая система содержит физические «координаты» файла. В файловой системе записывается, где расположена каждая часть файлов, поскольку запись на жесткий диск производится непоследовательно и одна часть файла может оказаться «в начале» диска, вторая — «в середине», а третья — «в конце». Поэтому нужна область, которая бы запоминала, где находится каждая часть файла. Такая область есть, она называется таблицей размещения файлов (File Allocation Table, FAT).
Файл может содержать любые данные, например текст, графику, музыку, видео и др. У файла есть свое имя. Подробно об имени файла мы поговорим в следующем разделе, а пока ограничимся одним именем. Например, строка «report» вполне может быть именем файла. Для чего нужно имя файла, надеюсь, объяснять не нужно: для удобства пользователя. Ведь компьютеру все равно, как обратиться к той или иной области на диске. А вот пользователю намного удобнее работать с символьными названиями.
Имя файла состоит из двух частей — имени и расширения. Имя файла может включать следующие символы:
прописные и строчные буквы латинского алфавита;
прописные и строчные буквы кириллицы;
Теперь поговорим о расширении. Имя файла может содержать несколько (или ни одной вообще) точек. Часть имени файла, находящаяся после последней точки, называется расширением. Если в имени файла вообще нет точки, тогда у него нет и расширения. Особых ограничений на расширение файла не накладывается — нормы те же, что и для имени, но обычно расширение составляют четыре или менее латинских символа. Вот некоторые примеры расширений:
doc — документ MS Word;
txt — текстовый документ;
xls — книга MS Excel;
ppt — презентация Power Point;
cdr — векторная картинка Corel Draw;
html — HTML-страничка (допускаются оба расширения);
jpg — картинка в формате JPEG;
exe — исполнимый файл (программа);
com — тоже исполнимый файл (старого формата, сейчас поддерживается, но разработчики программного обеспечения уже не создают исполнимые файлы такого формата);
dll — файл динамической библиотеки, содержащей функции, которые используются исполнимыми файлами (программами);
bak — резервная копия какого-нибудь файла (обычно текстового);
wbk — резервная копия документа MS Word;
tmp — временный файл, можно смело удалять.
Расширение используется для определения типа файла, а также для связи файлов и программ, которые могут обработать файлы данного типа. Например, если вы пытаетесь открыть файл с расширением. doc, то система автоматически запустит текстовый процессор MS Word и загрузит в него нужный вам документ. Обычно пользователю не нужно вводить расширение файла — его автоматически дописывает программа, чтобы пользователь случайно не ошибся.
Windows не чувствительна к регистру символов, т. е. ФАЙЛ. txt и файл. txt будут одним и тем же именем файла. Но существуют операционные системы, чувствительные к регистру букв в имени файла, например Unix, Linux, которые часто устанавливаются на серверах Интернета. Когда будете работать в «паутине», то знайте, что для сервера Интернета имена ФАЙЛ. txt и файл. txt будут разными именами файлов.
Существуют зарезервированные имена файлов (вы не можете создать файл с таким именем):
LPT1—LPT4 — данные имена зарезервированы для обмена информацией с принтерами (или другими устройствами), подключенными к параллельным портам;
СОМ1—COM4 — используются для обмена данными с устройствами, подключенными к последовательным портам;
NUL — пустое устройство;
CON — консоль, при выводе в этот файл производится запись на консоль, а при вводе из этого файла осуществляет ввод с клавиатуры;
Данные имена файлов остались в наследство от операционной системы DOS (для совместимости), вы их использовать, скорее всего, не будете, но и создать файл с таким именем не сможете.
Данный текст является ознакомительным фрагментом.
Продолжение на ЛитРес
Читайте также
Установка размера файла, инициализация файла и разреженные файлы
Установка размера файла, инициализация файла и разреженные файлы Функция SetEndOfFile позволяет переустановить размер файла, используя текущее значение указателя файла для определения его размера. Возможно как расширение, так и усечение файла. В случае расширения файла
Файл Файл – это логически обособленная, именованная совокупность данных (текстовых, графических, звуковых, видеоданных), которая может храниться на различных носителях информации (жестком диске, компакт-диске, «флэшке», дискете) и рассматривается при хранении и
(8.15) Пропал файл подкачки, W2k при загрузке каждый раз создаёт временный на 20 мегабайт. Выставление файла вручную не помогает, после загрузки его опять нет.
(8.15) Пропал файл подкачки, W2k при загрузке каждый раз создаёт временный на 20 мегабайт. Выставление файла вручную не помогает, после загрузки его опять нет. Это может произойти при повреждении системных файлов. Причина этого может быть разной, от не вовремя пропавшего
Файл Пункты меню Файл сгруппированы в несколько блоков:Первый из них посвящен созданию новых файлов. Пункт Создать предполагает открытие в окне редактирования пустого документа. Пункт Создать из шаблона предоставляет на выбор с десяток вариантов, позволяющих создать
REG-файл
REG-файл Можно вносить изменения в реестр путем внесения новых значений для нужных параметров в самом редакторе реестра или при помощи импорта. Но есть и другой способ. Можно заранее подготовить файл в заданном формате, и нужные параметры автоматически установятся в
9.6.2. Файл /etc/printcap
5.8.3. Файл конфигурации
5.8.3. Файл конфигурации По умолчанию используется файл конфигурации /etc/syslog.conf. Кроме этого вы можете указать другой файл конфигурации с помощью опции –f. Давайте рассмотрим установки демона на примере обычного файла конфигурации (см. листинг 5.4).Листинг
Файл desktop.ini
Файл desktop.ini Еще один интересный специальный файл, с помощью которого можно выполнить настройку оболочки Windows XP. Например, с его помощью можно изменить значок для папки, в которой он будет находиться, создать для нее описание и сделать многое другое. Для примера попробуем
Файл Чтобы установить на записываемый компакт-диск пароль, перейдите на вкладку Файл (см. рис. 12.1) и введите пароль в поле, расположенное слева от кнопки Р. Защита паролем доступна только для Главного меню (обратите внимание на положение переключателя Тип меню). Чтобы
Файл Makefile
Файл pkg-plist
Файл pkg-plist Файл составляется как раз на основе протокола инсталляции install.log, который был сохранен во время установки программы. Следует также учесть, что программы для KDE часто используют локальные скрипты libtool, которые устанавливают динамические библиотеки, используя
Архивирование в REG-файл
Архивирование в REG-файл Самым простым способом является создание резервной копии с помощью Редактора реестра. В левой панели окна редактора следует установить указатель мыши на ветвь Компьютер (в этом случае будет сохранен весь реестр; если необходимо сделать копию
все файловые системы, поддерживаемые Windows, используют концепцию файлов и каталогов для доступа к данным, хранящимся на диске или устройстве. Windows разработчики, работающие с Windowsными api-интерфейсами для файлов и устройств, должны понимать различные правила, соглашения и ограничения имен файлов и каталогов.
Доступ к данным можно получить с дисков, устройств и сетевых ресурсов с помощью API файлового ввода-вывода. Файлы и каталоги вместе с пространствами имен являются частью концепции пути, которая представляет собой строковое представление места получения данных независимо от диска, устройства или сетевого подключения для конкретной операции.
Некоторые файловые системы, такие как NTFS, поддерживают связанные файлы и каталоги, которые также следуют соглашениям об именовании файлов и правилам, как обычный файл или каталог. Дополнительные сведения см. в разделах жесткие связи, соединения и точки повторного анализа и операции с файлами.
Дополнительные сведения см. в следующих подразделах:
дополнительные сведения о настройке Windows 10 для поддержки длинных путей к файлам см. в разделе ограничение максимальной длины пути.
Имена файлов и каталогов
Ограничения количества символов также могут быть разными и могут различаться в зависимости от используемого формата префикса файловой системы и имени пути. Это усложняется за счет поддержки механизмов обратной совместимости. Например, более старая файловая система MS-DOS FAT поддерживает не более 8 символов для базового имени файла и 3 символа для расширения, а всего 12 символов, включая разделитель точек. Обычно это называется именем файла 8,3. Windows файловые системы FAT и NTFS не ограничиваются 8,3 именами файлов, так как они имеют длинную поддержку имен файлов, но по-прежнему поддерживают версию 8,3 длинных имен файлов.
Соглашения об именах
Следующие фундаментальные правила позволяют приложениям создавать и обрабатывать допустимые имена файлов и каталогов независимо от файловой системы.
Используйте точку, чтобы отделить базовое имя файла от расширения в имени каталога или файла.
Используйте обратную косую черту ( \ ) для разделения компонентовпути. Обратная косая черта разделяет имя файла от пути к нему и одно имя каталога из другого имени каталога в пути. Нельзя использовать обратную косую черту в имени для фактического файла или каталога, так как это зарезервированный символ, разделяющий имена в компоненты.
Не думайте о чувствительности к регистру. Например, имена OSCAR, OSCAR и OSCAR должны быть одинаковыми, даже если некоторые файловые системы (такие как POSIX-совместимая файловая система) могут считать их разными. Обратите внимание, что NTFS поддерживает семантику POSIX для чувствительности к регистру, но это не поведение по умолчанию. Дополнительные сведения см. в разделе CreateFile.
Обозначения томов (буквы диска) не учитывают регистр. Например, «D: \ » и «d: \ » ссылаются на один и тот же том.
Используйте любой символ в текущей кодовой странице для имени, включая символы Юникода и символы в расширенном наборе символов (128 – 255), за исключением следующих:
Следующие зарезервированные символы:
Символы, целочисленное представление которых находится в диапазоне от 1 до 31, за исключением альтернативных потоков данных, в которых разрешены эти символы. дополнительные сведения о файловых потоках см. в разделе file Потоки.
Любой другой символ, который не разрешен целевой файловой системой.
Используйте точку в качестве компонента каталога в пути для представления текущего каталога, например. \temp.txt «. Дополнительные сведения см. в разделе paths.
Используйте две последовательные точки (..) как компонент каталога в пути, чтобы представить родителя текущего каталога, например. \temp.txt «. Дополнительные сведения см. в разделе paths.
Не используйте следующие зарезервированные имена для имени файла:
CON, PRN, AUX, NUL, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9, LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8 и LPT9. Также Избегайте этих имен сразу после расширения; Например, не рекомендуется использовать NUL.txt. Дополнительные сведения см. в разделе Пространства имен.
Не завершайте имя файла или каталога с пробелом или точкой. хотя базовая файловая система может поддерживать такие имена, оболочка Windows и пользовательский интерфейс не поддерживаются. Однако можно указать точку в качестве первого символа имени. Например, «. temp».
Короткие и длинные имена
Длинное имя файла считается любым именем файла, которое превышает короткое соглашение об именовании в стиле MS-DOS (также называемое 8,3). при создании длинного имени файла Windows также может создать короткую форму 8,3 имени, именуемую псевдонимом 8,3 или коротким именем, а также сохранить ее на диске. Это 8,3 может быть отключено для повышения производительности в зависимости от конкретной файловой системы.
Windows server 2008, Windows Vista, Windows Server 2003 и Windows XP: 8,3 псевдонимы не могут быть отключены для указанных томов до Windows 7 и Windows Server 2008 R2.
Во многих файловых системах имя файла будет содержать символ тильды (
) в каждом компоненте имени, которое слишком длинное для соответствия правилам именования 8,3.
Не все файловые системы следуют соглашению о подстановке тильды, и системы могут быть настроены на отключение создания псевдонима 8,3, даже если они обычно поддерживаются. Поэтому не следует предполагать, что псевдоним 8,3 уже существует на диске.
Чтобы запросить 8,3 имен файлов, длинных имен файлов или полного пути к файлу из системы, рассмотрите следующие варианты.
в новых файловых системах, таких как NTFS, exFAT, udf и FAT32, Windows сохраняет длинные имена файлов на диске в юникоде, что означает, что исходное имя длинного файла всегда сохраняется. Это справедливо даже в том случае, если длинное имя файла содержит символы национальных алфавитов, независимо от того, какая кодовая страница активна во время операции чтения или записи с диска.
файлы, использующие длинные имена файлов, можно скопировать между разделами файловой системы NTFS и Windows разделами файловой системы FAT без потери сведений об имени файла. Это может быть неверно для старых файлов MS-DOS FAT и некоторых типов файловых систем CDFS (CD-ROM) в зависимости от фактического имени файла. В этом случае короткое имя файла подставляется по возможности.
Если компонент пути является именем файла, то он должен быть последним компонентом.
Каждый компонент пути также будет ограничен максимальной длиной, указанной для конкретной файловой системы. Как правило, эти правила делятся на две категории: Short и Long. Обратите внимание, что имена каталогов хранятся в файловой системе как файлы особого типа, но правила именования для файлов также применяются к именам каталогов. Для суммирования путь — это просто строковое представление иерархии между всеми каталогами, которые существуют для определенного имени файла или каталога.
Полные и относительные пути
для функций API Windows, которые управляют файлами, имена файлов часто могут относиться к текущему каталогу, в то время как некоторым api требуется полный путь. Имя файла задается относительно текущего каталога, если он не начинается с одного из следующих:
Если имя файла начинается только с обозначения диска, но не с обратной косой черты после двоеточия, то оно интерпретируется как относительный путь к текущему каталогу на диске с указанной буквой. Обратите внимание, что текущий каталог может быть или не являться корневым каталогом, в зависимости от того, на что он был установлен во время последней операции «изменение каталога» на этом диске. Ниже приведены примеры этого формата.
Путь также считается относительным, если он содержит «двойные точки»; то есть две точки вместе находятся в одном компоненте пути. Этот Специальный описатель используется для обозначения каталога над текущим каталогом, в противном случае известный как «родительский каталог». Ниже приведены примеры этого формата.
Относительные пути могут сочетать оба типа примеров, например «К. \tmp.txt «. Это полезно, поскольку, несмотря на то, что система отслеживает текущий диск вместе с текущим каталогом этого диска, она также следит за текущими каталогами на разных буквах диска (если в системе несколько), независимо от того, какой из обозначений установлен в качестве текущего диска.
Ограничение максимальной длины пути
Пространства имен
существует две основные категории соглашений о пространствах имен, используемых в Windows api, которые обычно называются пространствами имен NT и пространствами имен Win32. Пространство имен NT было разработано как пространство имен самого низкого уровня, в котором могут существовать другие подсистемы и пространства имен, включая подсистему Win32 и, по расширениям, пространства имен Win32. POSIX — это еще один пример подсистемы в Windows, построенной на основе пространства имен NT. ранние версии Windows также определили несколько предопределенных или зарезервированных имен для определенных специальных устройств, таких как порты связи (последовательные и параллельные) и консоль экрана по умолчанию, как часть того, что теперь называется пространством имен устройств NT, и все еще поддерживаются в текущих версиях Windows для обеспечения обратной совместимости.
Пространства имен файлов Win32
Префиксы и соглашения пространств имен Win32 приведены в этом разделе и в следующем разделе с описанием того, как они используются. обратите внимание, что эти примеры предназначены для использования с функциями API Windows и не всегда работают с приложениями оболочки Windows, такими как Windows Explorer. по этой причине существует более широкий диапазон возможных путей, чем обычно доступно в Windows приложениях оболочки, а Windows приложения, использующие его, можно разрабатывать с помощью этих соглашений по пространству имен.
Так как он отключает автоматическое расширение строки пути, \ \ префикс «? \ » также позволяет использовать «..» и «.» в именах путей, которые могут быть полезны при попытке выполнить операции с файлом, в противном случае зарезервированные описатели относительных путей в составе полного пути.
Обратите внимание, что для префикса «?» можно использовать только API-интерфейсы Юникод, что \ \ \ позволяет превысить максимальный _ путь
Пространства имен устройств Win32
при работе с функциями API Windows следует использовать \ \ префикс «. \ » для доступа только к устройствам, а не файлам.
Пространства имен NT
чтобы сделать эти объекты устройств доступными для приложений Windows, драйверы устройств создают символьную ссылку (символьную ссылку) в пространстве имен Win32 «Global??» для соответствующих объектов устройств. Например, COM0 и COM1 в разделе «Global??» подкаталог — это просто символических ссылок Serial0 и Serial1, «C:» — это символьную ссылку до HarddiskVolume1, «отображается physicaldrive0» — символьную ссылку до DR0 и т. д. без символьную ссылку указанное устройство «Xxx» будет недоступно для любого Windows приложения, использующего соглашения о пространстве имен Win32, как описано выше. Однако для этого устройства можно открыть маркер, используя любые интерфейсы API, поддерживающие абсолютный путь к пространству имен NT формата » \ устройство \ xxx».