R

에서 테이블 요약을 만들기 위해 적용 사용 방법 R- 더미에서 테이블 요약을 만들기 위해 적용 사용 방법

tapply ()를 사용하여 R에서 데이터의 표 요약을 만들 수 있습니다. tapply ()를 사용하면 데이터에 하위 그룹 요약을 쉽게 만들 수 있습니다. 이 함수는 세 개의 인수를 취합니다 :

  • X : 벡터

  • INDEX : 인수 또는 인수 목록

  • FUN : A 함수 < 999 >> 예를 들어, 홍채 데이터 세트의 평균 세파 길이를 계산하십시오 : >> tapply (홍채 $ 세피아 길이, 홍채 $ 종, 평균) setosa versicolor virginica 5. 006 5. 936 6. 588

코드의 짧은 라인, 당신은 몇 가지 강력한 것들을 않습니다. 당신은 R에게 Sepal을 가져 가라고 말한다. 길이 열을 종 (Species)에 따라 분할 한 다음 각 그룹의 평균을 계산합니다.

  

이것은 R로 코드를 작성하는 데 중요한 관용구이며, 일반적으로 SAC (Split, Apply, and Combine)라는 이름으로 사용됩니다. 이 경우 벡터를 그룹으로 분할하고 각 그룹에 함수를 적용한 다음 그 결과를 벡터로 결합합니다.

물론 with () 함수를 사용하면 다음과 같이 약간 더 읽기 쉬운 방법으로 코드 행을 작성할 수 있습니다 : >> with (iris, tapply (Sepal. Length, Species, mean)) setosa versicolor virginica 5 . 006 5. 936 6. 588

tapply ()를 사용하여 더 복잡한 테이블을 작성하여 데이터를 요약 할 수도 있습니다. 목록을 INDEX 인수로 사용하여이 작업을 수행 할 수 있습니다.

 tapply ()를 사용하여 고차원 테이블을 생성하는 방법 

예를 들어, 자동차 엔진 및 성능에 대한 데이터가있는 내장 데이터 프레임 인 데이터 프레임 mtcars를 요약합니다. . >> str (mtcars)

변수 am은 엔진에 자동 (0) 또는 수동 (1) 엔진이 있는지 여부를 나타내는 숫자 벡터입니다. 변속 장치. 이것은 매우 설명 적이 지 않기 때문에 새로운 객체 인 cars (mtcars의 사본)를 작성하고 열을 AM으로 변경하면됩니다.

>> cars <- within (mtcars, + am <- factor (am, levels = 0 : 1, labels = c ( "자동", "수동")) 각각의 기어 박스 유형에 대해 갤런 당 평균 마일을 찾으려면 tapply ()를 사용하십시오 : 자동 매뉴얼 17. 14737 24. 39231

예, 당신 말이 맞아요. 이것은 여전히 ​​1 차원 테이블입니다. 이제, 기어 박스 (am)와 기어 수 (gear)의 유형을 가진 2 차원 테이블을 만듭니다 : >> (자동차, tapply (mpg, 목록 (기어, 암), 평균)) 자동 매뉴얼 3 16. 10667 NA 4 21. 05000 26. 275 5 NA 21. 380

 tapply ()를 사용하여 데이터의 표 요약을 작성합니다. 이것은 table () 함수와 조금 비슷합니다. 그러나 table ()은 임시 테이블 (즉, 테이블 수) 만 작성할 수 있지만 tapply ()를 사용하면 모든 함수를 집계 함수로 지정할 수 있습니다.즉, tapply ()를 사용하면 수, 평균 또는 다른 값을 계산할 수 있습니다. 

단일 벡터에 대한 통계를 요약하려면 tapply ()가 매우 유용하고 빠르게 사용됩니다.

aggregate ()를 사용하는 방법
 매우 유사한 작업을 수행하는 또 다른 R 함수는 aggregate () :  >>와 (cars, aggregate (mpg, list = 기어, 기어, am = am) ) gear am x 1 3 자동 16. 10667 2 4 자동 21. 05000 3 4 수동 26. 27500 4 5 수동 21. 38000 

다음으로 수식 인터페이스를 사용하여 집계 ()를 새 높이로 가져옵니다.