Problem och procedurer som är involverade i jobbval

Innan vi fortsätter till en undersökning av de grundläggande urvalsmodeller som är tillgängliga för psykologen, är det nödvändigt att ta en kort titt på den generella multipla prediktionsmodellen. Denna modell brukar kallas multipelregressionsmodellen. I det allmänna prediktionsparametmet utvecklar vi en regressionslinje för att passa den uppsättning datapunkter som definieras av människors poäng på en prediktor (x-axeln eller abscissen) och på kriteriet ( y-axel eller ordinat).

Figur 3.1 visar en sådan situation. Regressionslinjen i Figur 3.1 är en rak linje och är belägen så att summan av de "quared avstånden från varje punkt till linjen (kör parallellt med y-axeln) är så liten som möjligt. Vi använder en bäst passande rak linje eftersom vi har antagit ett linjärt förhållande mellan x och y.

Den grundläggande formeln för en rak linje är

y = a + bx

Där y = förutsagt poäng på kriterium

a = en konstant som anger den punkt vid vilken regressionslinjen korsar y-axeln

b = linjens lutning, representerad av Δy / xx eller förändringen i y observerad för en motsvarande förändring i x

x = observerad poäng på prediktor

Således visas den grundläggande regressionsmodellen som visas i figur 3.2.

Observera att i regressionslinjen korsar y-axeln y-axeln till ett värde av 2. Således a = 2. Observera också att för varje 2-enhetens ökning i x finns en motsvarande 1-enhet ökning i y. Således Δy / Δx = 1/2 = 0.5 = b. Regressionsekvationen blir då

y = 2 + 0, 5x

Med tanke på ett x-värde har vi en regressionslinje som tillåter oss att förutsäga ay-poäng motsvarande det. Till exempel, om x var 8, då

y = 2 + 0, 5 (8)

= 2 + 4

= 6

För att sammanfatta: I det enkla prediktionsfallet beräknar man en bäst passande rak linje till de observerade punkterna, där termen "bästa passform" betyder summan av kvadrerade avvikelser för de observerade värdena runt linjen kommer att vara ett minimum.

Formlerna som är nödvändiga för att beräkna konstanterna a och b som definierar denna bäst passande linje kallas "minsta kvadrater" formler och är följande:

Formeln för b är ett förhållande mellan kovariansen mellan prediktorn och kriteriet och den totala variationen i prediktorn. När kriterievarianansen och prediktorvarian är lika, motsvarar b = r eller lutningen på regressionslinjen korrelationskoefficienten.

Två predikanter:

Det är logiskt att anta att om prediktor X 1 kan bidra till en framgångsrik förutsägelse av kriteriescore och om prediktor X 2 också kan bidra till en framgångsrik förutsägelse av kriteriescore, skulle användningen av båda prediktorerna tillsammans kunna möjliggöra bättre övergripande prediktering än att använda antingen prediktor individuellt. Graden till vilken de två prediktorerna (när de kombineras) kommer att förbättra förutsägbarheten beror emellertid på flera faktorer, varav viktigast är korrelationen mellan de två prediktorerna själva.

Tänk på exempelvis situationen där två prediktorer varje korrelerar väsentligen med ett kriterium men inte korrelerar med varandra, enligt följande:

Tydligt kan en stor ytterligare kriterievariant förklaras med hjälp av prediktor 2 tillsammans med prediktor 1. Det kombinerade sambandet mellan två eller flera prediktorer och ett kriterium kallas en multipel korrelation och har symbolen R. Såsom var fallet med r 2, värdet på R "representerar den totala mängden kriterievariant som kan förklaras med användning av flera prediktorer. När prediktorerna 1 och 2 inte är korrelerade med varandra kan den kvadrerade multipla korrelationskoefficienten visas som en additiv funktion av de individuella kvadrerade korrelationskoefficienterna, eller

R 2 c . 12 = r2 1c + r2 2c (3, 1)

När (interkorrelation av prediktorer) är noll så är den kvadrerade multipelgyldigheten summan av de kvadrerade individuella validiteterna.

När två prediktorer är korrelerade med varandra blir sakerna något mer komplexa. Tänk på en situation (som i följande diagram) där varje prediktor har betydande individuell validitet men där r 12 är också ganska stor.

På grund av interkorrelationen mellan dessa prediktorer visar diagrammet att mängden överlapp mellan prediktor 2 och kriteriet kan delas in i två delar: det område som är unikt för prediktor 2 och det område som delas med prediktor 1. Således är användningen av en andra prediktor i denna situation tillåter oss att redogöra för mer kriterievarian än vad som kan göras med hjälp av prediktor 1 ensam, men all kriterievarianans förutspådd av 2 är inte ny varians. En allmän regel kan därför anges om flera prediktorer.

Allt annat lika, ju högre korrelationen mellan prediktorer är, desto mindre blir den övergripande förutsägelsen förbättrad genom att använda båda prediktorerna tillsammans. Det extrema fallet skulle naturligtvis vara den situation där prediktorerna var perfekt korrelerade och vi skulle inte ha någon ytterligare kriterievariant som berodde på att tilläggsprocessor 2 till vårt urvalsbatteri skulle läggas till.

När det gäller två prediktorer som är korrelerade med varandra kan vi uttrycka R2 som en funktion av de separata validiteterna och storleken på interkorrelationen mellan prediktorer med formeln 2

R 2 c . 12 = r2 1c + r2 2c - 2r 12 r 1c r 2c / 1 - r2 12 (3.2)

notera att om r 12 = 0, reducerar formel 3.2 till

R 2 c . 12 = r2 1c + r2 2c

vilken är formel 3.1.

En mer tydlig illustration av påverkan av prediktorinterkorrelation på storleken av multipelkorrelationskoefficienterna kan erhållas från tabell 3.1, där exempel på R och R2-värden ges för par av prediktorer som har validiteter av 0, 30, 0, 50 och 0, 70 under hypotetiska förhållanden av 0, 00, 0, 30 och 0, 60 interkorrelation. Figur 3.3 visar den allmänna trenden med hjälp av uppgifterna i tabell 3.1. Psykologens moral är ganska uppenbar - undviker att använda prediktorer som är lämpliga för att vara mycket relaterade till varandra.

Prediction Equations:

Förutsägningsekvationen i en två-prediktorsituation är en förlängning av one-predictor-modellen. Den allmänna formen av ekvationen är

y = a + b 1 x 1 + b 2 x 2 (3, 3)

Detta är ekvationen för ett plan istället för en rak linje. För läsaren bekant med geometri, visar figur 3.4 en tredimensionell ritning av relationerna mellan variablerna x 1, x 2 och y som motsvarar ekvation 3.3. Formler finns tillgängliga som gör det möjligt att beräkna konstanterna a, b och som kommer att resultera i det bäst anpassade regressionsplanet. När dessa konstanter har bestämts kan den resulterande ekvationen användas för att göra kriterieprestanda förutsägelser för nya arbetssökande, med tanke på deras poäng på de separata prediktorerna.

För att illustrera, anta att data finns tillgängliga på 100 män anställda för jobb X under en viss månad som innehåller poäng i två tester samt kriteriedata efter en sexmånadersperiod. Dessa data kan analyseras för att bestämma värdena för a, b 1 och bi som bäst beskriver förhållandena mellan variablerna.

Antag att följande ekvation var slutresultatet:

y = 2 + 0, 5x 1 + 0, 9x2 (3, 4)

Denna ekvation säger att det mest sannolika kriteriet poäng för någon ny hyra kommer att vara lika med hälften hans poäng på test 1 plus nio tiondelar hans poäng på test 2 plus två. Således om en ny sökande poängerar 20 på test 1 och 30 på test 2, skulle hans förväntade kriterieprestanda i slutet av sex månader från anställningstiden vara

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

Utvidgningen av två-prediktormodellen till en k-prediktormodell, där k är ett stort antal potentiella pre-dikter av arbetssucces, är inte för svårt begreppsmässigt. Vår modell expanderar till formuläret

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + ... + b k x k (3, 5)

Beräkningsförfarandena för att lösa minst kvadratvärdena för alla konstanterna i en sådan ekvation blir emellertid ganska komplexa om man inte har datormöjligheter tillgängliga. Läsaren är också försiktig att komma ihåg att i alla föregående diskussioner har det varit implicit, antagandet av en linjär värld, dvs alla relationerna mellan par av variabler är linjära. Det är möjligt att modifiera multipelregressionsmodellen för att undvika detta antagande, men det ligger utanför ramen för denna bok.

moderatorer:

Ett av de viktigaste begreppen i val- och placeringsteori är begreppet moderatorvariabel. Ibland kallad en populationskontrollvariabel kan en moderatorvariabel ses som en variabel som, när den varieras systematiskt, har en effekt på storleken av förhållandet mellan två eller flera andra variabler.

Kanske ett hypotetiskt exempel (Figur 3.15) om hur en moderator kan fungera kommer att tjäna för att illustrera dess inflytande på urvalsprocessen. Den övre scatter-ploten illustrerar en allmän validitet på 0, 50 mellan prediktorn och ett kriterium. Emellertid är "befolkningen" som representeras i scatter-plot en som innehåller båda könen, det vill säga, både män och kvinnor är grupperade ihop för att bestämma validiteten. Även en avslappnad inspektion av toppskottsplotten indikerar (om män och kvinnor kodas annorlunda som har gjorts här) att mönstret av poäng observerat för män skiljer sig från det som observerats för kvinnor.

För att få en tydligare bild av exakt hur de skiljer sig, visar de två nedre scatter-diagrammen i Figur 3.15 förhållandet mellan prediktorkriterierna separat för män och kvinnor. Nu är skillnaden slående. För männen observerar vi ett högt positivt förhållande-ett som ger en giltighet på 0, 80. För kvinnorna ser vi däremot att det finns praktiskt taget inget samband mellan prediktorn och kriteriet. Giltigheten för kvinnor är 0, 05.

Moderatorvariabeln i ovanstående exempel är naturligtvis variabeln av kön. Förhållandet mellan prediktor och kriterium påverkas drastiskt av att man varierar moderatorn. Frågan "vad är min prediktors giltighet" blir klart mer komplex. Vad som ursprungligen tycktes vara en måttligt respektabel giltighet har nu blivit in i två ganska tydliga och separata validiteter, en mycket hög och en mycket låg.

Ett namn för dessa senare giltigheter kan vara villkorliga validiteter, det vill säga förutsägelsens giltighet, med tanke på att befolkningen består av kvinnor eller med tanke på att befolkningen består av män. En intressant egenskap hos moderatorvariabler är att en moderator inte behöver ha någon direkt relation med antingen prediktorn eller kriterievariabeln (det vill säga r ym och r im = 0).

Exempel på moderatorer:

Faktiska exempel på moderatorer har hittats i ett antal forskningsundersökningar. Vroom (1960) hittade till exempel ganska märkta moderatoreffekter med hjälp av grad av motivation hos chefer och första linjeledare som modereringsvariabeln. Alla män studerade var anställda i antingen Chicago eller New York-fabriken i ett nationellt leveransföretag som specialiserat sig på att leverera små paket och paket från avdelningen och andra butiker till privata bostäder. Data från studien som bäst illustrerar moderatorkonceptet ges i Tabell 3.4.

Alla handledare delades in i tre grupper utifrån deras bedömda motivationsgrad genom att använda en sammansättning av flera motivationsindex som erhölls i forskningen. Valider för ett test av icke-verbal resonemang förmåga erhölls sedan för var och en av fyra olika typer av tillsynsbetyg av dessa män.

Detta gjordes separat vid varje motivationsnivå. Som tabell 3.4 visar var testet tydligen en ganska giltig förutsägare för hur hög en man skulle bli betygsatt av sin handledare om endast män med hög motivation övervägdes. Om vi ​​systematiskt varierar motivationen genom att flytta ner till grupperna med endast måttliga eller låga motivationsnivåer ser vi en motsvarande systematisk förändring i förhållandet mellan testet och kriteriet. Ju lägre arbetstagarens motivation, desto mindre är prediktorns giltighet, blir validiteten till och med negativ för lågmotivationsgrupperna.

Andra exempel på moderatorer finns i studier av Dunnette och Kirchner (1960) och Ghiselli och hans medarbetare (1956, 1960). Dunnette och Kirchners arbete har främst riktats till att identifiera arbetsrelaterade moderatorer som grupperar människor i jobb som liknar deras ansvar för att få maximal förutsägelse inom varje arbetsgrupp.

Ghisellis metod kan kallas ett "variabelt fria" moderatorsystem. Folk grupperas helt enkelt på grundval av hur bra deras framgång kan förutsägas utan direkt hänvisning till någon extern variabel. Fredericksen och Gilbert (I960) har också forskat på moderatorer för att bestämma i vilken grad en moderatörs effekt sannolikt kommer att vara konsekvent över tiden. De fann att en moderator identifierad i en 1954 studie (Fredericksen och Melville, 1954) var fortfarande verksam i en I960 uppföljning.

Modern mot traditionell urvalsteori:

Konceptet moderatorvariabel illustrerar kanske bäst modemmodellen i val och placering. Traditionellt har urval och validering varit problem som betraktades som bäst lösas genom att helt enkelt upprätta ett kriterium som verkade vara tillförlitligt och en prediktor som bäst kan förutsäga detta kriterium.

Tyngdpunkten var nästan fullständigt vid upprättandet av en hög giltighet med liten eller ingen tanke på att utforska de många ytterligare variablerna som, när de varierar, kan lägga till eller subtrahera från den erhållna korrelationen. Det allmänna mottot som alltför ofta verkade typifiera urvalsmetodiken var slagordet "Om det fungerar, använd det!"

Utan frågan var denna politik ansvarig för ganska olika utvecklingar inom industrip psykologi. För det första bidrog det antagligen till i vilken grad psykologer accepterades i industrin. Ledningen är allmänt inriktad mot positiva resultat som representeras av förbättrat urval, och är inte alltför oroad över hur det uppnås.

Tyvärr är denna orientering dock förmodligen ansvarig för det faktum att validitet i prediktionen inte har ökat väsentligt (om alls) under de senaste 50 åren - en ganska störande kommentar till ansträngningarna hos psykologer som arbetar med denna typ av arbete.

I en recension från 1955 av ett stort antal giltighetsstudier indikerade Ghiselli (1955) att det verkligen är en ovanlig händelse att få en validitetskoefficient på 0, 50 eller bättre. Figur 3.16 presenterar frekvensfördelningar som Ghiselli presenterar av validitetskoefficienter med varierande storheter för olika typer av jobb. Observera att det endast finns ett stort antal validiteter över 0, 50 endast vid fördelningen av validiteter för arbetskraftsarbetare som använder intelligenstester som prediktorer och kompetensåtgärder som kriterier.

Det nuvarande intresset för moderatorer är representativt för en bredare och något mer sofistikerad inställning till urval. Det kan spåras när Toops (1948) appellerade till psykologer att överväga möjligheten att genom att stratifiera människor (till exempel arbetare) systematiskt enligt personliga variabler, bör man kunna förbättra förutsägelsen. Hans klassificeringsmetod, som han hänvisade till som tilläggsproceduren, är moderatorns föregångare.

Dunnettes valmodell:

Kanske den nuvarande vyn mot urvalsmetodiken kan bäst representeras av den urvalsmodell som Dunnette (1963) föreslog. Denna modell visas i diagrammet som presenteras i Figur 3.17 och är utformat för att peka på labyrinten om komplexiteter och relationer som finns i urvalssituationen. Modellen kan ses som mer än ett försök att bara påpeka det dynamiska urvalet av urvalet - det utgör också en grund för psykologer att utnyttja dessa dynamik och använda dem till bästa för att förbättra förutsägbarheten.

Man kan förmodligen förstå den synpunkt som representeras av modellen när det gäller den exakta beskrivningen som används av Dunnette (1963, s. 318):

Observera att den modifierade prediktionsmodellen tar hänsyn till de komplexa interaktioner som kan förekomma mellan prediktorer och olika prediktorkombinationer, olika grupper (eller typer) av individer, olika beteenden på jobbet och konsekvenserna av dessa beteenden i förhållande till organisationens mål . Modellen tillåter möjligheten att prediktorer är differentiellt användbara för att förutsäga beteenden hos olika undergrupper av individer.

Vidare visar det att liknande arbetsbeteenden kan vara förutsägbara genom ganska olika mönster av interaktion mellan grupperingar av prediktorer och individer eller ens att samma prestationsnivå på prediktorer kan leda till väsentligt olika mönster av arbetsbeteende för olika individer. Slutligen erkänner modellen den irriterande verkligheten att samma eller liknande arbetsbeteenden kan leda till ganska olika organisatoriska konsekvenser efter att ha passerat genom det situativa filtret.

Den nuvarande trenden i urvalet som presenteras av moderatorns medvetenhet och av Dunnettes valmodell bör resultera i framsteg i både den ökade effektiviteten av urvalet och graden av förståelse för dynamiken med exakt förutsägelse.

Suppressorvariabler:

Ingen diskussion om urvalet skulle vara komplett utan att det nämns några suppressorvariabler. I en mening liknar en suppressorvariabel en moderatorvariabel genom att den definieras som "en variabel som kan ha en effekt på storleken av ett givet prediktorkriterieförhållande trots att det har liten eller ingen relation till själva variabelvariabeln. ”

Dynamiken hos en suppressorvariabel i prediktering kan bäst förstås genom att återigen granska begreppet partiell korrelation och dess relaterade åtgärd, den halvpartiella korrelationen. Om man hade två prediktorer och ett kriterium som var korrelerade som visas här, så partiell korrelation mellan kriteriet och prediktorn x, vilket är r 1c. 2 definierades som korrelationen mellan x 1 och C efter att effekterna av x 2 har delats ut av båda, så

Antag att vi bara vill ta bort effekterna av X2 från kriteriet före beräkningen av korrelationen. En sådan korrelation kallas en halvpartiell eller delkorrelation. Till exempel kan vi vara intresserade av korrelationen mellan intelligens testresultat (vår prediktor x 1 ) och slutlig färdighetsnivå i slutet av ett skrivprogram (kriteriet) x 2 kan representera den initiala kompetensnivån för alla anställda när det gäller deras typhastighet innan de tar kursen. Således vill vi ta bort effekterna av den ursprungliga kompetensnivån vid slutresultatet innan vi beräknar giltigheten av vårt intelligenstest.

Vår halvpartiella korrelation blir nu:

Mekanismen för en suppressorvariabel är identisk med den som visas ovan, med undantag av (1) generellt sett har variabel x 2 endast en liten (om någon) relation till kriteriet och (2) man är intresserad av att avlägsna dess effekter från prediktor x 1 .

Den allmänna situationen kan därför schematiseras som:

Man kan inte med fullständig säkerhet förutse huruvida partiella eller halvpartiella korrelationer blir större eller mindre än den enkla korrelationen som existerar mellan variablerna, eftersom storleken på både täljaren och nämnaren påverkas av partiallingsprocessen. Den enda gången detta inte är så är variabeln som delas ut är endast relaterad till en av de två andra variablerna, som i fallet med undertryckaren. I en sådan situation påverkas endast nämnaren (variansen avlägsnas) och den resulterande halvpartiella korrelationen är större än den enkla odelade korrelationen mellan variabler.

Korsvalidering:

En egenskap hos de flesta multipelpresiktionssystem är att man i sin utveckling tenderar att kapitalisera den chansvariation som existerar i urvalet av anställda som används för validering. Detta är särskilt sant med multipelregressionsmodellen men gäller också för multipliceringsproceduren. Eftersom multipelregressionsmodellen har minst kvadratiska egenskaper, dvs vi medvetet minimerar felen vid att förutsäga vårt speciella prov, är det troligt att om vi nu tillämpar vår ekvation på ett nytt prov (från samma population), kommer vi inte hitta vår förutsägelse lika effektiv som tidigare.

Således är vår beräknade R 2 en överskattning av vad framtidsgiltigheten för vårt förutsägelsessystem är lämpligt, eftersom användningen av vår ekvation med syfte att förutsäga automatiskt innebär att den tillämpas på nya prover av arbetare. Detta förväntade fall i R2 är känt i statistik som krympproblemet och kan bäst illustreras genom att undersöka Figur 3.18.

I Figur 3.18 har vi två prover av individer. Var och en representerar ett slumpmässigt prov som dras från eller tillhör samma befolkning. Exempel A kan till exempel representera alla arbetssökande för jobb X under oddtalade månader, och prov B kan representera alla arbetssökande under de jämntalade månaderna för ett visst år.

Det skulle vara mycket ovanligt, även med mycket stora antal sökande i varje prov, för att de två proverna skulle vara identiska med avseende på deras sprickor. Eftersom deras sprickor kan förväntas variera beroende på provtagningsfel kan även korrelationen mellan prediktorn och kriteriet (validitet) förväntas variera något, liksom regressionsekvationen beräknas på varje prov.

Antag att vi tog regressionsekvationen beräknad på prov A och använde den för att förutsäga poäng från prov B. Vi kunde uppenbarligen inte göra så bra ett jobb för att minimera med A-raden med prov B som vi kunde använda B-regressionslinjen - trots allt, B-linjen definierar per definition Σd 2 för det provet. Vilken annan rad som helst kommer därför att ha ett större fel i samband med det. Således måste R2 reduceras motsvarande.

Det finns formler tillgängliga för att uppskatta hur mycket krympning man kan förvänta sig när man använder denna ekvation på ett nytt prov. En sådan formel är

R2 = 1 - [(1 - R2) n-1 / n-k-1]

Var

R 2 = krympad multipel korrelation kvadrerade

R2 = multipel korrelationskvadrat erhållen från valideringsprovet

n = antal personer i valideringsprovet

k = antal prediktorer i regression ekvation

Det är bäst att korsvalidera ekvationen genom att erhålla ett andra prov och försöka se hur bra det förutsäger. Om det verkar finnas en mycket stor droppe, kan man vilja ändra ekvationen (kanske genom att kombinera båda proven i en grupp). Stor krympning hittas oftast när provstorlekarna är små och / eller antalet prediktorer är stora i förhållande till provstorleken.

Mosier (1951) har diskuterat ett antal typer av tvärvalidering som kan utföras beroende på studiens utformning och huruvida man är bekymrad över att generalisera endast till ett nytt prov eller om bredare generaliseringar samordnar dysförutsägningsekvationen önskas (till exempel, till olika kön, olika kriterier, etc.). Den förra kallas ett fall av validitetsgeneralisering; Det senare är ett fall med förlängning av giltighetstiden. Naturligtvis skulle större krympning förväntas i det senare fallet och formel 3.9 på% gäller för fall av validitetsgeneralisering.