Metabase. Руководство пользователя 02. Краткий обзор баз данных

Перевод страницы документации Metabase A Short Overview of Databases.

Прежде чем начать работать с Metabase полезно изучить ключевые термины баз данных.

Таблицы

Базы данных это коллекции таблиц. Таблицы содержат одну или большее число колонок и неограниченное число строк. Каждая строка состоит из ячеек и каждая ячейка содержит значение соответствующее столбцу под котором она находится.

Это пример таблицы:

Name Age
John 25
Jenny 31

Таблица содержит колонки Name и Age. Первая строка содержит две ячейки, со значениями John и 25 соответствующие колонкам Name и Age.

Колонки

Ячейки в колонках содержат определённый вид информации. Например, в приведённой таблице колонка Name содержит имена в каждой ячейке, а колонка Age перечисляет возраста.

Примеры типов колонок:

  • Строки (TEXT, CHAR, VARCHAR). Такие столбцы хранят имена, адреса и другую текстовую информацию.
  • Числовые типы (Integer, Float, DoubleFloat, Decimal). Такие столбцы хранят целые и дробные числа. В них могут содержаться стоимость, баланс счета, количество, возраст и др.
  • Дата и время (Timestamp). Такие столбцы хранят дату, время, или дату и время одновременно.
  • Идентификаторы (первичные ключи). Ячейки в таких столбцах уникально идентифицируют каждую строку. Представьте приложение для бронирования автомобиля. Идентификатор бронирования может быть номером бронирования. Два бронирования не могут иметь один номер бронирования. Таким образом каждое бронирование уникально идентифицируется своим номером.

Пример, таблица бронирования:

Reservation ID Name Age
11 John 25
12 Jenny 31

В таблице выше, колонка Reservation ID является идентификатором (первичным ключом). Колонка Name имеет строковый тип, а Age числовой (целые числа — Integer).

Связи

Таблицы в базе данных ссылаются друг на друга, образуя связи.

Например, в нашей гипотетической базе данных приложения бронирования, две таблицы: одна для бронирований (Reservations), другая для клиентов (Customers).

Чтобы соединить данные бронирования с соответствующими данными клиента мы используем вторичный ключ. Вторичный ключ — это специальная колонка в таблице которая ссылается на колонку в другой таблице. Почти всегда колонка со вторичным ключом ссылается на идентификатор (первичный ключ) в другой таблице.

Например, мы соединяем каждое бронирование с соответствующим клиентом с помощью столбца Customer в таблице Reservations который содержит идентификаторы клиентов из колонки ID таблицы Custimers.

Reservations

ID Customer Date Car
1 11 12/20/2015 Toyota Camry
2 12 1/2/2016 Range Rover

Customers

ID Name Age
11 John 25
12 Jenny 31

Для анализа базы данных нашего гипотетического приложения через Metabase мы можем задать вопрос:

Какой средний возраст клиентов которые делали бронирование в феврале 2015 года?

Для того чтобы сделать это мы открываем таблицу Reservation, добавляем фильтр чтобы рассматривать только бронирования между 1 и 28 февраля 2015 года, и выбираем Average of… для выбора среднего значения возраста, теперь мы выбираем внешний ключ и выбираем колонку Age из таблицы Customers на которую ссылается таблица Reservations.

Задать вопрос

Теперь когда у нас общий словарь и базовое понимание баз данных, мы начнём задавать вопросы к данным.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *