Описание файла auto-mpg.data
Этот файл представляет собой список моделей автомобилей с некоторыми их характеристиками. Файл получен со страницы проекта Machine Learning Repository Калифорнийского университета. Данные были собраны в 1983 году в университете Карнеги-Мелон. Более подробная информация доступна по ссылке выше.
Структура файла
Файл auto-mpg.data представляет собой текстовый файл в кодировке UTF-8. Каждая строка файла описывает одну модель автомобиля. Поля файла разделены двумя и более пробелами. Последнее поле (название) от остальных отделено символом табуляции (который "\t"
) и взято в кавычки, вот примерно так:
xxx⋅⋅⋅⋅⋅xxx⋅⋅⋅xxx⋅⋅⋅⋅⋅⋅⋅xxxx⋅⋅⋅⋅⋅⋅xxx→"xxxxxx"
Здесь символ ⋅ означает пробел, а символ → означает "\t"
. Скачайте файл и откройте в текстовом редакторе, чтобы увидеть формат своими глазами.
Столбцы файла представляют собой следующие данные:
Потребление топлива, в милях на галлон. Число типа
float
.Число цилиндров в двигателе. Число типа
int
.Рабочий объём двигателя (видимо, в кубических дюймах). Число типа
float
.Мощность двигателя, в лошадиных силах. Число типа
float
. Для некоторых автомобилей мощность не указана, вместо числа стоит знак?
.Масса автомобиля, в фунтах. Число типа
float
.Разгон до 60 миль/час, в секундах. Число типа
float
.Модельный год, число типа
int
, две цифры. То есть, например, модельный год 74 означает 1974.Регион производства, число типа
int
. Значения:- США
- Европа
- Юго-восточная Азия
Название модели, строка. Это поле отделено от предыдущего не пробелами, а символом табуляции. Кроме того, оно начинается и заканчивается символом кавычки (
"\""
).