R - мова і безкоштовне середовище програмування, що застосовується найчастіше для статистичних обчислень, аналізу даних та представлення результатів у графічному вигляді (візуалізації). Мова програмування R є нащадком та “діалектом” мови S, розробленої ще в середині 1970-их компанією Bell Labs (яка пізніше стала AT&T, а тепер – Lucent Technologies). Проект R був розпочатий у 1995 році працівниками кафедри статистики Оуклендського університету, і швидко набрав популярності. На даний момент проект підтримується зусиллями волонтерів. Веб-сторінкою проекту R є www.r-project.org.

Періодично випускаються нові версії середовища R, які можна знайти, наприклад, на вказаному сайті. Функціональні можливості R (програми, функції, динамічні бібліотеки) містяться у так званих пакетах. Зазвичай R завантажується та інсталюється із набором базових пакетів, що містять значну кількість часто застосовуваних функцій. Крім того, можна встановлювати і підключати величезну кількість додаткових пакетів, які значно розширюють можливості R. Розробником додаткового пакету R може бути будь-хто. Величезна кількість математиків, статистів та інших дослідників при розробці ними нового методу аналізу, чи якогось алгоритму, реалізують його у вигляді додаткового пакету R. Усі пакети R доступні для завантаження із Загального Мережевого Архіву R (Comprehensive R Archive Network, CRAN). Цей архів має велику кількість так званих інтернет-дзеркал, тобто сайтів із тотожним вмістом. Таким чином, користувач може здійснювати завантаження із найближчого до нього (за географічним розташуванням) дзеркала. На жаль, жодного українського дзеркала CRAN не існує. Найближчими до нас є:

дзеркала. З цих джерел можна завантажити як середовище R, так і будь-які додаткові пакети.

Після встановлення та запуску R (у операційних системах Windows) з’являється віконце із стартовим повідомленням, і під цим повідомленням знаходиться символ > . Це віконце – консоль R, а символ > запрошує до введення команди. Введена команда виконується після натискання клавіші Enter.

Чому у R немає таблиці для даних і кнопок (як, наприклад, в MS Excel, або в деяких програмах для статистичних обчислень)?

Тому що R має таку величезну кількість можливостей, що помістити усі варіанти кнопками, піктограмами, пунктами та ін. просто неможливо. А ще R здатен працювати (і часто працює) із різними об’єктами, не лише табличної форми.

Якщо Ваша команда у R є досить довгою, то можна натиснути Enter і продовжити введення у новому рядку. Тобто у випадку введення неповної команди у R замість > з’являється символ +, що передбачає введення закінчення цієї команди. Щоб вийти з R, можна ввести q(), або ж вибрати пункт Exit у меню File. При цьому R задасть запитання, чи слід зберігати поточне робоче середовище у файл. По замовчуванню, при кожному запуску R шукає останнє збережене робоче середовище і завантажує його. “Усвідомте R як калькулятор на стероїдах” (автор невідомий). Зробимо перше і найпростіше обчислення - один плюс один:

1 + 1
## [1] 2

Запис [1] означає, що відповідь є вектором, і даний рядок відповіді починається із першого елемента цього вектора. Вектор у спрощеному розумінні є рядком або стовпцем елементів – чисел чи символів.

sqrt(81)  # коментар – функція sqrt() обчислює квадратний корінь.
## [1] 9
cos(pi/3)
## [1] 0.5
  • Знайомимося із першими функціями R.

Функція (в математиці) - це правило, яке кожному елементу з першої множини (області визначення) ставить у відповідність один і тільки один елемент з другої множини (Вікіпедія).

Функція (в програмуванні) – найчастіше поіменована (рідко – безіменна) сукупність операцій, яка приймає певні аргументи та повертає певні результати (які залежать від цих аргументів).

Функція sqrt() (від англ. square root) – повертає квадратний корінь від переданого їй аргументу. Функція cos() – повертає косинус переданого їй кута (в радіанах). pi – число пі (спеціальна константа у R). Символ / позначає оператор ділення. По суті, терміни оператор і функція є тотожними, адже обидва приймають аргументи і повертають результат. Різниця лише у формі запису операторів (знаходяться між або перед аргументами) та функцій (вказується ім’я функції і у круглих дужках – аргументи). Так, команду 1+1 можна записати і за допомогою функції: sum(1,1). Символ # означає початок коментара – тобто все, що знаходиться після # не буде сприйматись R як команда. Коментарі можна використовувати для написання коротких пояснень до коду (команд). Зверніть увагу на крапку в 0.5 – у R, так як і у більшості англомовних країн, Китаї та Японії, десятковим розділювачем виступає крапка. А кома – використовується для розділення різних чисел. Внаслідок цього можливі конфлікти при спробі перенести числа з програм українсько/російськомовного MS Office (Excel, Word та ін.) чи OpenOffice у R, адже попередньо треба або всі десяткові коми замінити на крапки, або ж у налаштуваннях самої офісної програми (або у параметрах операційної системи) змінити символ десяткового розділювача на крапку.

  • Ключові слова:
  • R