Язык программирования R/Данные

Материал из Викиучебника — открытых книг для открытого мира

Работа с внешними данными[править]

Загрузка данных (файлов)[править]

x <- foreign::read.spss(имя файла) # открыть файл, сохраненный в SPSS.

После этого мы получаем колонки (variables в терминах SPSS) в векторах состоящих из имени объекта х и имени переменной файла SPSS после знака $. Например, если в файле были переменные var001 и Index, то они теперь хранятся в x$var001 и x$Index соответственно.
Демаскировка имен переменных (для прямой видимости в R) и их маскировка осуществляются командами attach() и detach().

Сохранение данных[править]

Для сохранения текущей сессии вместе с данными необходимо использовать команду
q("yes")
Если же надо экспортировать только данные...

Сохранение результатов[править]

Работа с Hadoop[править]

Какие есть возможности по работе с MapReduce?

Преобразования данных[править]

= Сортировка данных в файле[править]

Объединение файлов[править]

= Добавление наблюдений[править]

Добавление переменных по ключу[править]

Аггрегация файлов[править]

Создание новых файлов с аггрегированными либо частично транспонированными ячейками

Использование SQL[править]

это возможно?

Фильтрация[править]

Фильтрация с удалением[править]

Взвешивание наблюдений[править]

ls() перечислить все активные объекты rm(obj1) удалить объект