Metoder som används för att bedöma arbetsprestanda

Industripsykologen har ett urval metoder för att fastställa ett förfarande för att bedöma arbetsprestanda som inbegriper bedömningar från individen. Dessa metoder kan grupperas i klasser beroende på vilken typ av jämförelse som krävs av den person som gör bedömningen. De tre vanligaste är ratingsystem, rankningssystem och parvisa jämförelser.

1. Betygssystem:

Mekaniken i något betygssystem är ganska enkelt. Dommarens uppgift är att fatta en dom om hur mycket personen har, eller beskrivs av, en särskild egenskap. Även om det kan ta många olika former, är det en särskiljande egenskap att domaren kan ge två individer samma poäng, en egenskap som inte finns i de andra två metoderna.

Numeriska betygsvågar:

Denna form är förmodligen den mest populära och vanliga typen av betygsskala. Sådana vågar kallas ofta "grafiska vågar".

Ett exempel ges nedan:

Dommarens uppgift är att ge varje arbetare en poäng från 1 till 9 som bäst beskriver hans "grad av pålitlighet". Kriteriepoängen för en arbetare är vanligtvis genomsnittet för alla domare. I det läge där ett antal olika frågor innefattar kriteriet (till exempel graden av pålitlighet, allmän nivå av arbetskunskap, relationer med andra arbetstagare etc.) blir problemet mer komplicerat. Ofta är det totala kriteriet som används helt enkelt den totala poängen för alla frågor.

Men när flera frågor används för att utvärdera arbetstagare måste man omedelbart möta det kompositte versus flera kriteriumproblemet. Ett tillvägagångssätt blir mer populärt i sådana situationer är att analysera frågorna för att bestämma underliggande oberoende kriteriedimensioner och sedan att tilldela "faktorvärden" på var och en av dessa dimensioner som sedan används som kriterier.

Standardvågar:

En annan typ av betygsskala innebär användning av en uppsättning standarder eller exempel för jämförelseändamål. Dessa används i stället för eller tillsammans med de verbala förankringspunkterna som finns med den grafiska skalan.

En standardskala som är utformad för att utvärdera pålitlighet kan se ut så här:

Rateren kan sedan jämföra mannen han betygsätter med män på jobbet som är betecknade som skala referenspunkter. Denna metod kallas också ibland som en jämförelseskala mellan män och män. Den stora svårigheten med standardvågor finns i att hitta lämpliga standarder. Detta kräver vanligtvis noggrann förskalning av en grupp nuvarande anställda. Det finns också det mycket noga med att använda namnen på dessa män utan någon gener. Man måste alltså vara mycket försiktig med att standardskalan inte får offentliggöras. En annan svårighet är att intervallen mellan männen på skalan ofta inte är lika stor.

Fördelen med metoden är ganska tydlig. Så länge en grupp dommar kan komma överens om kvalifikationerna för en liten grupp arbetare som är välkända för alla domare, tillhandahålls en färdig jämförelseskala som garanterar att alla domare kommer att ha en gemensam referent för att betygsätta resten av männen.

Kumulerad poängskala (Checklista):

Många betygsvågar kräver att domaren ska kontrollera eller ange vilken av ett antal uttalanden, adjektiv eller attribut som är beskrivande för den person som har betygsatt sig. Exempelvis är ratingformen som visas i Figur 7.3 representativ för en adjektivkontrolllista.

Varje person tilldelas ett totalt poäng baserat på de specifika punkterna som kontrolleras. I det visade exemplet kan en person få en + 1 för varje gynnsamt adjektiv och a - 1 för varje ogynnsamt adjektiv. I mer utförliga kontrolllistor kan de olika objekten tilldelas differentialvikter. Uhrbrock (1961) har till exempel skannat 2000 uttalanden om arbetarnas beteende.

Varje uttalande har fått ett medelvärde för sin uppfattade förmåga att beskriva en arbetare. Uttalanden kan sedan väljas för användning på en checklista som i sin tur används av chefer för att betygsätta sina anställda. Metoden för scoring kan baseras på antingen den totala (algebraiska summan) poängen för de objekt som kontrolleras eller kanske medianvärdet (medelvärdet) för alla punkter som kontrolleras. Några exempel på Uhrbrocks uttalanden, tillsammans med deras skalvärden, visas i tabell 7.3.

Kritisk Incident Check List:

Den kritiska incident-tekniken är ett förfarande som utvecklats av Flanagan (1954). Som normalt används kan det förmodligen bäst beskrivas som en kontrolllista för kontrolllista. Det är emellertid också tillräckligt annorlunda i sin utveckling att det förtjänar en separat omnämning.

Metoden innebär tre separata steg:

1. Samla in kritiska händelser

2. Skalning av incidenterna

3. Konstruera checklistan skala

Steg ett är det som gör denna metod unik. Begreppet kritisk incident hänvisar till alla de anställdas beteenden hos personer som övervakaren anser vara "anmärkningsvärda". Anmärkningsvärt kan i sin tur hänvisa till fall av antingen enastående "bra" eller "dålig" on-the- jobbbeteende. Varje handledare är med andra ord uppmanad att tillhandahålla så många exempel på enastående verkligt beteende som han kan komma ihåg. Dessa jobbincidenter presenteras sedan (steg två) till en expertgrupp som tilldelar skalvärden om huruvida denna händelse är önskvärd.

I steg tre är en kontrolllista uppbyggd som endast omfattar de uttalanden eller incidenter som ansågs vara relevanta för att definiera "bra" och "fattiga" arbetare. Dessa kontrolllistor kan sedan användas av en handledare för att betygsätta sina arbetare. Vid betyg av en arbetstagare placerar han helt enkelt en checkmark vid sidan av varje incident som han har observerat den arbetstagaren "begå" eller uppvisa. Poängen för en arbetare tas vanligen som medelvärdet eller medianskalavärdet av alla händelser som kontrolleras för honom (totalpoäng kan också användas).

Den kritiska händelsekontrolllistan har den stora fördelen att den är baserad på faktiska arbetsbeteenden eller incidenter. En handledare är inte i stånd att vara tvungen att bedöma egenskaper eller rangordna sina arbetare etc. Han behöver bara svara på huruvida han eller hon inte har eller inte har observerat en viss händelse hos varje arbetstagare. Kirchner och Dunnette (1957) har rapporterat gynnsamma resultat i en studie som följde något enligt proceduren ovan.

Innan vi lämnar kritiska incidentmetoden bör det påpekas att det har mer generality och tillämpning än att bara vara en källa för resultatvärderingschecklista. Arbetsbaserade beteendehändelser har använts mycket framgångsrikt inom forskning inom ledarskapet (Fleishman, 1955), organisationsvärden (Shartle, Brumback och Rizzo, 1964) och kreativitet (Buel, 1960).

2. Rangordningssystem:

Ett kännetecken för ett betygssystem är att det medger att två eller flera individer har samma betygsskala eller skalansvärde. Ett rankningssystem av sin natur motverkar detta. Enkel ranking kräver att domaren beställer individerna från högsta till lägsta.

En viss grupp av handledare kan således rangordna tio anställda enligt nedan:

Ranking system har den inneboende fördelen genom att de är extremt enkla att förklara och är vanligtvis enkelt accepterade av de personer som är tilldelade som domare. Förfarandet "ger mening" till dem. Det har också fördelen att en rater kan rangordna ett ganska stort antal individer utan stora svårigheter. En tumregel erkänner att tillfredsställande och tillförlitliga resultat med ett rankningssystem kan uppnås med Ns så stora som 50 till 60.

Guilford (1954) har påpekat en annan fördel med rangordningen. Eftersom domaren är tvungen att göra jämförelser mellan män och män snarare än absoluta jämförelser, måste han jämföra individer när man bestämmer sig för att placera varandra över varandra.

Metoden tvingar domaren att diskriminera mellan de individer som rankas oavsett om han känner att de verkligen är annorlunda! Antag att de tio män som ges i vårt tidigare exempel var ganska lika i sin förmåga. Domarna skulle då förmodligen ha en mycket svår tid att försöka rangordna männen, och en doms rangordning skulle vara mycket bedräglig om de tio mänens relativa fördelar.

Ett sätt att kolla på denna möjlighet är naturligtvis att använda flera domare. Om domarna är överens om deras rangordningar kan möjligheten att det inte finns några "riktiga" eller sanna skillnader bland männen diskonteras. I det tidigare exemplet verkar domarna vara rimligt konsekventa för att bedöma vem som är bra och vem är en fattig arbetare. Således måste deras val baseras på några verkliga snarare än slumpmässiga skäl för att beställa de berörda männen. Detta är en utmärkt anledning till att använda flera domare när det är möjligt och för att beräkna avtalet bland domare med något index som en korrelationskoefficient.

3. Paired Jämförelser:

Även om rankordningssystemet implicit kräver att en man jämförs med andra på listan under rankingsprocessen, är detta inte systematiskt inbyggt i metoden. Ett förfarande som systematiskt tvingar rateren att jämföra varje man med varannan man är känd som metoden för parvis jämförelse. Tänk exempelvis på situationen där fyra anställda utvärderas av en handledare. Om vi bildar alla möjliga par av män, kommer vi att ha N (N- l) / 2 sådana par bildade; i vårt fall, 4 (3/2) = 6 par.

Det vanliga förfarandet är då att presentera var och en av paren (en i taget) till handledaren. Handledaren indikerar (vanligen med en check) vilken av de två män som han tycker är bäst. En parad jämförelsematris kan sedan konstrueras som den som visas nedan, där följande regel används: När en handledare föredrar en kolumn till en rad placerar du ett märke i den cellen.

Antag att övervakare X gör följande bedömningar om de sex pararna:

Om vi placerar talmärken i vår matris med hjälp av ovanstående regel har vi följande:

Sålunda betraktar denna handledare B som den bästa arbetaren, följd i ordning av C, A och D. I verklig praxis ingår domar från ett antal domare i matrisen för att ge en mer stabil uppskattning av ordningens meriter av männen utvärderas. Dessutom är det vanligt att konvertera proportionerna inom varje cell till standardpoäng (Z-poäng) och sedan hitta en genomsnittlig Z-poäng för varje kolumn.

Denna genomsnittliga Z-poäng är då skalansvärdet för den person som representeras av den kolumnen i matrisen. Fördelen med det senare förfarandet ii att dessa skalvärden kan tas som att representera inte bara rangordning av arbetarnas förmåga utan också som en indikation på graden av vilka två arbetare skiljer sig i förmåga.

En enkel illustration baserad på svaren från tio hypotetiska handledare till de fyra män som betygsätts ovan kan vara till hjälp. Låt oss först överväga följande talmatris

Låt oss nu konvertera tallymatrisen till en proportionsmatris, där vi definierar en andel som ⁿ / _N, där n är lika med antalet stämmer i en cell och N är lika med antalet dommar eller antal möjliga talmärken. Det är vanligt att ange proportioner på 0, 50 i alla diagonala celler, även om vi inte faktiskt någonsin presenterar en person som är parad med sig själv för domarna.

Nästa steg är att konvertera proportionerna till Z-poäng. (En tabell för att göra detta finns i någon elementär bok om statistik.)

Om vi lägger till en konstant på 0, 78 till alla skalvärden för att ta bort negativa tecken kan individerna representeras längs ett fortlöpande kontinuitet

Observera att avståndet mellan C och A är betydligt större än avståndet mellan D och A eller B och C. Om antagandena för denna metod har uppfyllts kan dessa relativa avstånd betraktas som indikativa för de relativa skillnaderna i meriter bland de individer som är nominerade - ett tilltalande kännetecken för denna prestationsbedömningsmetod. För en mer detaljerad täckning av parvis jämförelse, se Edwards (1957) eller Guilford (1954).

En av nackdelarna med metoden för parvisa jämförelser är att den inte är särskilt användbar när antalet individer som ska betygsätt blir stor. Tidigare var det påpekat att en handledare med stor sannolikhet kunde ranka order 50 eller 60 arbetare. Om vi försökte använda parningsproceduren skulle vi ha

50 (49) 72 = 1225 par

Även om en handledare skulle kunna arbeta med sex par per minut, skulle det kräva mer än tre timmar att uppnå betyg. Ju större antal personer som ska klassificeras desto mer astronomiskt blir tidskravet.