Язык программирования Python

Курс IT-Академии Сухорукова

Апрель-июнь 2020

Следующее занятие

6 июня в 11:00 NOVT

Описание файла auto-mpg.data

Этот файл представляет собой список моделей автомобилей с некоторыми их характеристиками. Файл получен со страницы проекта Machine Learning Repository Калифорнийского университета. Данные были собраны в 1983 году в университете Карнеги-Мелон. Более подробная информация доступна по ссылке выше.

Структура файла

Файл auto-mpg.data представляет собой текстовый файл в кодировке UTF-8. Каждая строка файла описывает одну модель автомобиля. Поля файла разделены двумя и более пробелами. Последнее поле (название) от остальных отделено символом табуляции (который "\t") и взято в кавычки, вот примерно так:

xxx⋅⋅⋅⋅⋅xxx⋅⋅⋅xxx⋅⋅⋅⋅⋅⋅⋅xxxx⋅⋅⋅⋅⋅⋅xxx→"xxxxxx"

Здесь символ ⋅ означает пробел, а символ → означает "\t". Скачайте файл и откройте в текстовом редакторе, чтобы увидеть формат своими глазами.

Столбцы файла представляют собой следующие данные:

  1. Потребление топлива, в милях на галлон. Число типа float.

  2. Число цилиндров в двигателе. Число типа int.

  3. Рабочий объём двигателя (видимо, в кубических дюймах). Число типа float.

  4. Мощность двигателя, в лошадиных силах. Число типа float. Для некоторых автомобилей мощность не указана, вместо числа стоит знак ?.

  5. Масса автомобиля, в фунтах. Число типа float.

  6. Разгон до 60 миль/час, в секундах. Число типа float.

  7. Модельный год, число типа int, две цифры. То есть, например, модельный год 74 означает 1974.

  8. Регион производства, число типа int. Значения:

    1. США
    2. Европа
    3. Юго-восточная Азия
  9. Название модели, строка. Это поле отделено от предыдущего не пробелами, а символом табуляции. Кроме того, оно начинается и заканчивается символом кавычки ("\"").