Перейти к содержанию

Язык программирования R/Данные

Материал из Викиучебника — открытых книг для открытого мира

Работа с внешними данными

[править]

Загрузка данных (файлов)

[править]

x <- foreign::read.spss(имя файла) # открыть файл, сохраненный в SPSS.

После этого мы получаем колонки (variables в терминах SPSS) в векторах состоящих из имени объекта х и имени переменной файла SPSS после знака $. Например, если в файле были переменные var001 и Index, то они теперь хранятся в x$var001 и x$Index соответственно.
Демаскировка имен переменных (для прямой видимости в R) и их маскировка осуществляются командами attach() и detach().

Сохранение данных

[править]

Для сохранения текущей сессии вместе с данными необходимо использовать команду
q("yes")
Если же надо экспортировать только данные...

Сохранение результатов

[править]

Работа с Hadoop

[править]

Какие есть возможности по работе с MapReduce?

Преобразования данных

[править]

= Сортировка данных в файле

[править]

Объединение файлов

[править]

= Добавление наблюдений

[править]

Добавление переменных по ключу

[править]

Аггрегация файлов

[править]

Создание новых файлов с аггрегированными либо частично транспонированными ячейками

Использование SQL

[править]

это возможно?

Фильтрация

[править]

Фильтрация с удалением

[править]

Взвешивание наблюдений

[править]

ls() перечислить все активные объекты rm(obj1) удалить объект