확률변수는 무작위 실험에서 발생하는 결과를 수치적으로 표현하는 변수로, 이산확률변수와 연속확률변수로 나뉜다.
이산확률변수는 특정한 값들만을 가질 수 있는 변수로, 독립적으로 발생하는 사건들을 표현한다.
확률분포는 확률변수가 특정 값을 가질 확률을 나타내는 함수로, 이산확률분포와 연속확률분포로 나뉜다.
연속확률변수는 특정 구간 내에서 무한한 값을 가질 수 있는 변수로, 주로 시간이나 온도와 같은 연속적인 데이터에 사용된다.
확률질량함수는 이산확률변수에 대해 각 특정 값이 발생할 확률을 나타내는 함수이다.
기댓값은 확률변수의 평균적인 값을 의미하며, 이산확률변수와 연속확률변수에 대해 각각 정의된다.
분산은 데이터가 평균으로부터 얼마나 퍼져 있는지를 나타내는 지표로, 편차의 제곱의 평균으로 계산된다.
표준편차는 분산의 양의 제곱근으로, 데이터의 변동성을 측정하는 데 사용된다.