Regresjonsanalyse eller variansanalyse er en samlebetegnelse på statistiske analysemetoder som har til mål å beskrive sammenhengen mellom én eller flere uavhengige variabler (x1, x2, og så videre) og en avhengig variabel (y).

Det gjøres ved å finne frem til en funksjon, det vil si et tilnærmet uttrykk eller en forenklet matematisk beskrivelse av den virkelige sammenhengen. Funksjonen gjør det mulig å fastsette verdien av y når man kjenner verdiene for de aktuelle x.

Man kan for eksempel finne et uttrykk for hvordan avlingsmengden av en kornsort avhenger av de uavhengige variablene gjødslingen (x1), den tilførte vannmengden (x2), temperaturen (x3) og så videre. Avlingsmengden er da avhengig variabel (y).

En av fordelene med regresjonsanalyse er at vi kan kontrollere for andre faktorer som påvirker både den uavhengige variabelen vi er interessert i og avhengig variabel.

Om man er interessert i å finne ut hvordan avlingsmengden varierer med varierende temperatur, holder man vannmengden og gjødslingen konstant. Kanskje øker mengden med 3 prosent for hver 10 prosents økning av temperaturen. Da sier man at de to variablene korrelerer eller samvarierer.

På den måten kan vi si mer om hvorvidt en uavhengig variabel faktisk har en direkte påvirkning på avhengig variabel. Når analysen gjennomføres med flere uavhengige variabler, kalles den multippel regresjonsanalyse.

Den mest vanlige formen for regresjonsanalyse er lineær regresjon, hvor sammenhengen mellom uavhengig og avhengig variabel beskrives ved hjelp av en rett linje.