Metabase. Руководство пользователя 02. Краткий обзор баз данных

Перевод страницы документации Metabase A Short Overview of Databasesopen in new window.

Прежде чем начать работать с Metabase полезно изучить ключевые термины баз данных.

Таблицы

Базы данных это коллекции таблиц. Таблицы содержат одну или большее число колонок и неограниченное число строк. Каждая строка состоит из ячеек и каждая ячейка содержит значение соответствующее столбцу под котором она находится.

Это пример таблицы:

NameAge
John25
Jenny31

Таблица содержит колонки Name и Age. Первая строка содержит две ячейки, со значениями John и 25 соответствующие колонкам Name и Age.

Колонки

Ячейки в колонках содержат определённый вид информации. Например, в приведённой таблице колонка Name содержит имена в каждой ячейке, а колонка Age перечисляет возраста.

Примеры типов колонок:

  • Строки (TEXT, CHAR, VARCHAR). Такие столбцы хранят имена, адреса и другую текстовую информацию.
  • Числовые типы (Integer, Float, DoubleFloat, Decimal). Такие столбцы хранят целые и дробные числа. В них могут содержаться стоимость, баланс счета, количество, возраст и др.
  • Дата и время (Timestamp). Такие столбцы хранят дату, время, или дату и время одновременно.
  • Идентификаторы (первичные ключи). Ячейки в таких столбцах уникально идентифицируют каждую строку. Представьте приложение для бронирования автомобиля. Идентификатор бронирования может быть номером бронирования. Два бронирования не могут иметь один номер бронирования. Таким образом каждое бронирование уникально идентифицируется своим номером.

Пример, таблица бронирования:

Reservation IDNameAge
11John25
12Jenny31

В таблице выше, колонка Reservation ID является идентификатором (первичным ключом). Колонка Name имеет строковый тип, а Age числовой (целые числа — Integer).

Связи

Таблицы в базе данных ссылаются друг на друга, образуя связи.

Например, в нашей гипотетической базе данных приложения бронирования, две таблицы: одна для бронирований (Reservations), другая для клиентов (Customers).

Чтобы соединить данные бронирования с соответствующими данными клиента мы используем вторичный ключ. Вторичный ключ — это специальная колонка в таблице которая ссылается на колонку в другой таблице. Почти всегда колонка со вторичным ключом ссылается на идентификатор (первичный ключ) в другой таблице.

Например, мы соединяем каждое бронирование с соответствующим клиентом с помощью столбца Customer в таблице Reservations который содержит идентификаторы клиентов из колонки ID таблицы Custimers.

Reservations

IDCustomerDateCar
11112/20/2015Toyota Camry
2121/2/2016Range Rover

Customers

IDNameAge
11John25
12Jenny31

Для анализа базы данных нашего гипотетического приложения через Metabase мы можем задать вопрос:

Какой средний возраст клиентов которые делали бронирование в феврале 2015 года?

Для того чтобы сделать это мы открываем таблицу Reservation, добавляем фильтр чтобы рассматривать только бронирования между 1 и 28 февраля 2015 года, и выбираем Average of… для выбора среднего значения возраста, теперь мы выбираем внешний ключ и выбираем колонку Age из таблицы Customers на которую ссылается таблица Reservations.

Задать вопрос

Теперь когда у нас общий словарь и базовое понимание баз данных, мы начнём задавать вопросы к данным.

Последниее изменение: 24.08.2023, 06:42:55