Տվյալների արտացոլման յոթ կեղտոտ գաղտնիք

Հեղինակ: Randy Alexander
Ստեղծման Ամսաթիվը: 23 Ապրիլ 2021
Թարմացման Ամսաթիվը: 16 Մայիս 2024
Anonim
Environmental Disaster: Natural Disasters That Affect Ecosystems
Տեսանյութ: Environmental Disaster: Natural Disasters That Affect Ecosystems

Բովանդակություն

Տվյալների արտացոլումը, և, մասնավորապես, վեբ վրա հիմնված տվյալների արտացոլումը, իր պահն ունի: JavaScript գրադարանները, ինչպիսիք են D3.js, Raphaël և Paper.js, որոնք հիմնված են Canvas- ի և SVG- ի ժամանակակից զննարկչի աջակցության վրա, ավելի հեշտ են դարձրել, քան երբևէ, ստեղծել բարդ պատկերացումներ, որոնք, մինչ վերջերս, համակարգչային գիտնականների նահանգ էին և մի շարք մասնագետներ: դիզայներներ:

Վիզուալիզացիան նախագծի առաջարկների և անձնական պորտֆելների մեջ նոր «պարտադիր է» տարրն է, և Platfora- ի, Datameer- ի և մեր սեփական գործատուների `ClearStory Data- ի և Chartio- ի նման նորաստեղծները միլիոններ են հավաքում զննարկիչների վրա հիմնված արտացոլման ինտերֆեյսերով վերլուծական հարթակների համար:

Որոշ չափով բզզոցն արդարացված է: Տվյալների արտացոլումը տվյալների ուսումնասիրման, նոր պատկերացումներ գտնելու և գրավիչ պատմություն պատմելու հրաշալի միջոց է: Որո՞նք են պատկերացման մշակողների իրական մարտահրավերները, և ի՞նչ չեն ուզում, որ դուք իմանաք նրանց աշխատանքի մասին:

Մենք ձեզ կառաջնորդենք տեղեկատվության արտացոլման (infovis) մասնագիտության կեղտոտ գաղտնիքներից մի քանիսի միջոցով ՝ ներսից ներկայացնելով պատկերացման մշակման գործընթացը, դրա անխուսափելի մարտահրավերներին և հիասթափություններին դիմակայելու գործնական գործիքներով և մոտեցումներով:


Գաղտնիք # 01. Իրական տվյալները տգեղ են

Տվյալների արտացոլման ձեռնարկների մեծ մասը սկսվում է հաճելի ֆանտազիայից. Տվյալների անաղարտ հավաքածու: Անկախ նրանից, թե դուք սովորում եք կառուցել հիմնական գծապատկեր կամ ուժային ուղղվածության ցանցային գծապատկեր, ձեզ ներկայացվում են մաքուր, նորմալացված, լավ ձևաչափված բազային տվյալներ: Այս կատարյալ JSON կամ CSV ֆայլը կոկիկորեն նախանշված աղմուկի թվային անալոգն է, որը տեղ է գտել հեռուստատեսային խոհարարական շոուում. Հոգնեցուցիչ, քրտնաջան աշխատանքի զտված արդյունքը, որը ներկայացվում է որպես հում բաղադրիչ: Գործնականում, գործ ունենալով իրական աշխարհի տվյալների հավաքածուների մեծ մասի հետ, ակնկալեք ծախսել ձեր ժամանակի մինչև 80% -ը ՝ ձեր տվյալները գտնելու, ձեռք բերելու, բեռնելու, մաքրելու և վերափոխելու համար:

Այս գործընթացի մի մասը կարող է իրականացվել ավտոմատացված գործիքների միջոցով, բայց տվյալների գրեթե ցանկացած մաքրում, որը ներառում է երկու կամ ավելի տվյալների հավաքածու, պահանջում է որոշակի մակարդակի ձեռքի աշխատանք: Գործիքների բազմազանությունը կարող է փոխել XLS- ը XML կամ ժամանակային դրոշմակնիքները այլ ամսաթվային ձևաչափերի, բայց ոչինչ չի կարող ավտոմատ կերպով քարտեզագրել մեկ ընկերության ներքին վաճառքի կատեգորիաները իր մրցակիցներին կամ հուսալիորեն գործ ունենալ տվյալների մուտքագրման տառասխալների, անհամատեղելի բնութագրերի կոդավորումների կամ (սարսուռ) աղքատ OCR:


Գործիքներ և ռազմավարություններ

  • Բյուջեն զգալի ժամանակ է տրամադրում տվյալների մաքրման ցանկացած արտացոլման նախագծում: Բարձրացրեք ձեր նախահաշիվը (որոշ դեպքերում `էքսպոնենցիալ) տվյալների մի քանի աղբյուրների, ձեռքով մուտքագրված կամ OCR տվյալների, տարանջատված դասակարգման սխեմաների և ոչ ստանդարտ ձևաչափերի համար:
  • Google Refine- ը տվյալների մաքրման հիանալի աշխատանքային ձի է, չնայած այն ունի սահմանափակումներ, մասնավորապես ոչ աղյուսակային տվյալների համար: Մաքրման հատուկ գործիքներից են `Data Wrangler- ը և Mr. Data Converter- ը:Այնուամենայնիվ, շատ առաջադրանքներ դեռ պահանջում են տարրական գիտելիքներ սցենարական լեզվով, ինչպիսին է Python- ը կամ Excel- ում ձեռքի աշխատանքը: Պահպանեք ձեր սցենարները. Դրանք նորից կօգտագործեք
  • Կերեք ձեր սեփական շան կերակուրը, եթե կարող եք. Արտացոլումը հիանալի գործիք է տվյալների խնդիրները բացահայտելու համար: Օգտագործեք ցրման գծագրեր և հիստոգրամներ ՝ կասկածելի հեռավորությունները գտնելու և շտկելու համար

Գաղտնիք # 02. Barանց գծապատկերը սովորաբար ավելի լավն է


Պոտենցիալ արտացոլման դիզայնը դիտարկելիս տրվող առաջին հարցերից մեկը «Ինչո՞ւ է սա ավելի լավ, քան ձողաձևը»: Եթե ​​դուք պատկերացնում եք մեկ քանակական չափում մեկ կատեգորիկ հարթության վրա, հազվադեպ է ավելի լավ տարբերակ: Նմանապես, ժամանակի վրա հիմնված տվյալները սովորաբար լավագույնս ցուցադրվում են գծային գծապատկերում, և ցրման գծերը հաճախ լավագույնն են երկու գծային չափումների փոխհարաբերությունները ուսումնասիրելու համար: Հետընթաց հնչելու ռիսկի տակ կան հիմնավոր պատճառներ, որ այս գծապատկերները շարունակական օգտագործման են ենթարկվել 18-րդ դարից ի վեր: Barանց գծապատկերները տեսողական համեմատությունները հեշտացնելու համար մատչելի լավագույն գործիքներից մեկն են `օգտագործելով կողք կողքի երկարությունները ճշգրիտ համեմատելու մեր բնածին ունակությունը:

Barանց գծապատկերի գերազանցության հետևանքը և, թերևս, ամենակեղտոտ գաղտնիքը այս հոդվածում, այն է, որ ամենաթեժ տեսք ունեցող պատկերացումները հաճախ պակաս օգտակար են: Սովորական արտացոլման նորույթն ու գեղագիտական ​​գրավչությունն արժեն ՝ տվյալների պարզությունը: Barանց գծապատկերի մեծամասնությունը դիտողին խնդրում է համեմատել այն տարբերությունները, որոնք մենք ավելի դժվար ենք հասկանում ՝ տարածքներ, անկյուններ, երանգներ կամ անթափանցիկություն: Լավագույն դեպքում, նման պատկերացումները դժվարացնում են համեմատությունը. վատթարագույն դեպքում դրանք ամբողջովին աղավաղում են տվյալները ՝ հեռուստադիտողներին տանելով կեղծ եզրակացությունների:

Գործիքներ և ռազմավարություններ

  • Մի մերժեք արտացոլման ավանդական ընտրանքները, եթե դրանք ձեր տվյալների համար լավագույն տարբերակն են: Սկսեք գծային և գծային գծապատկերներից և հետևեք միայն այն դեպքում, երբ տվյալները դա են պահանջում
  • Ունեն լավ հիմնավորում այլ տարբերակներ ընտրելու համար: Barանց գծապատկերների համեմատ ՝ պղպջակների գծապատկերներն աջակցում են տվյալների ավելի շատ կետերի ՝ ավելի մեծ արժեքների տիրույթով: կարկանդակներ և պոնչիկները հստակ ցույց են տալիս մասնակի հարաբերությունները. treemaps- ն աջակցում է հիերարխիկ կատեգորիաներին
  • Barանց գծապատկերներն ունեն ավելացված բոնուս `կատարելու ամենահեշտ պատկերացումներից մեկը. Դուք կարող եք ձեռքով կոդավորել HTML- ի արդյունավետ գծապատկեր ՝ օգտագործելով ոչ այլ ինչ, քան CSS և նվազագույն JavaScript, կամ պատրաստեք այն Excel- ում ՝ մեկ գործառույթով:

Գաղտնիք 03. Իրական տվյալների փոխարինող չկա

Մեկ տվյալների հավաքածուի մաքրումը և ձևաչափումը բավականաչափ դժվար է, բայց ի՞նչ կլինի, եթե դուք կենդանի պատկերացում եք կառուցում, որը գործարկվելու է բազում տարբեր տվյալների շտեմարաններով: Գուցե դուք ստիպված լինեք կառուցել պատկերացում ՝ մեկ ընկերության ներսում գտնվող բազմաթիվ ստորաբաժանումներում օգտագործելու համար, որտեղ յուրաքանչյուր բաժին ունի իր տվյալների բազան, և ժամանակ չունեք ձեռքով մաքրելու յուրաքանչյուր տվյալների բազան: Ձեր առաջին բնազդը կարող է լինել որևէ ցուցադրական տվյալներ վերցնելը և դրանց օգտագործումը ձեր պատկերացումը կառուցելու համար: ձեր արտացոլման գրադարանը կարող է նույնիսկ ստանդարտ տվյալների օրինակով լինել:

Unfortunatelyավոք, իրական տվյալների փոխարինող չկա: Դեմո տվյալները ձգտում են ունենալ նորմալ բաշխում և կառավարելի քանակությամբ գրառումներ. այն նախատեսված է տեսողական պատկերացումները իրենց լավագույն լույսի ներքո ցույց տալու համար: Barանց գծապատկերը պարզապես չունի նախադրյալների շարքը, այն կարծես իդեալական է գծապատկեր: Դա չի օգնում պլանավորել տվյալների անհամապատասխանությունները, զրոյական արժեքները, արտաքին գծերը կամ այլ իրական խնդիրներ: Եթե ​​չափազանց շատ եք ապավինում ցուցադրական տվյալների, իրական տվյալները միացնելիս կարող եք պարզել, որ ձեր արտացոլումը ամենալավը չէ, որը նախ հարմար է ձեր տվյալների համար:

Գործիքներ և ռազմավարություններ

  • Իդեալում օգտագործեք իրական տվյալների մի քանի պատահական նմուշ, եթե չեք կարող մուտք գործել մի ամբողջ շտեմարան
  • Անվավեր և բացակայող տվյալները երաշխիք են: Եթե ​​ձեր տվյալները չեն մաքրվելու նախքան գծագրվելը, մի մաքրեք ձեր ընտրանքային տվյալները
  • Իրական տվյալները կարող են այնքան մեծ լինել, որ ծանրաբեռնեն ձեր արտացոլումը կամ այն ​​առաջացնող համակարգը: Համոզված եղեք, որ եթե դուք օգտագործում եք տվյալների նմուշ, ճիշտ եք մեծացնում նմուշի չափը (կամ համապատասխանաբար նվազեցնում եք) նախքան վերջնական պատկերացում ստեղծելը

Գաղտնիք 04. Սատանան մանրամասների մեջ է

Ձեր արտացոլման համար պիտակների, լեգենդների և առանցքների նախագծումը հաճախ նախնական պատկերացման հետևանքն է: Բայց այս տարրերը կարևոր նշանակություն ունեն արտացոլման համար, և ճիշտ լինելը կարող է դժվար և ժամանակատար լինել, հատկապես, երբ չես կարող ժամանակից շուտ կանխատեսել տվյալները:

Ձեր արտացոլումը դնելիս թողեք մատուցման նշանակալի տարածք ձեզ համար անհրաժեշտ լրացուցիչ նշանների համար, հաճախ ներառելով համեմատաբար լայն լուսանցքներ ձեր պատկերացման գրաֆիկական մասի շուրջ: Առանցքի պիտակները պետք է լինեն այնպես, որ դրանք չփակեն միմյանց և հեշտությամբ ընթերցվեն: Անընթեռնելիության համար անհրաժեշտության դեպքում օգտագործեք պտտվող կամ տեղակայման պիտակներ: Եթե ​​որոշակի տարածք գերբնակեցված է պիտակներով, բայց դրանք պարզության համար ձեզ հարկավոր են, մտածեք, որ պիտակները ավելի հեռու են տեղափոխում իրենց հղած տարրերից և միացրեք դրանք նշող գծի հետ: Մեկ այլ տեխնիկա `մարդաշատ պիտակները խմբավորելը մեկ գործիքի նման խմբում: Հաշվի առեք ձեր թույլատրած տարածքը և ավելի երկար պիտակների երկարությունը: Եթե ​​պիտակները չեն տեղավորվում, գուցե հարկ լինի դրանք էլիպսերով կրճատել, կամ էլ ուղղակի կտրել տեքստը ֆիքսված երկարությամբ:

Նմանապես, լեգենդները պահանջում են նախնական պլանավորում ՝ լավ մատուցելու համար: Հեշտ տարբերակներից մեկը լեգենդի համար որոշակի տեղ հատկացնելն է գրաֆիկայի մի կողմ: Unfortunatelyավոք, սա նշանակում է, որ դուք պետք է նվազեցնեք ձեր պատկերացման գրաֆիկական մասի չափը: Որոշ տարածք պահպանելու համար գուցե դուք կարողանաք լեգենդը տեղադրել գրաֆիկայի դատարկ մասում, կամ լեգենդը քաշել, որպեսզի դիտողը կարողանա մուտք ունենալ ներքևում գտնվող ցանկացած գրաֆիկայի:

Գործիքներ և ռազմավարություններ

  • Պլանների, կացինների և լեգենդների համար պլանավորեք տարածություն ձեր գրաֆիկայի շուրջ
  • Նշեք պիտակների համար առավելագույն նիշի երկարությունը `անհրաժեշտության դեպքում կտրեք այն` մարդաշատությունը կանխելու համար: Խմբավորեք մոտակա պիտակները միասին ՝ դրանք բացահայտելով ի պատասխան օգտագործողի գործողությունների
  • Հաշվի առեք ոլորման կամ ակորդեոնի ոճի ընդլայնումը երկար լեգենդների համար
  • Ինչ էլ որ անեք, մի թողեք այս տարրերը: Պիտակները կարող են թվալ երկրորդական մտահոգություն, երբ կենտրոնացած եք գրաֆիկական տարրերի վրա, բայց դրանք անչափ կարևոր են ձեր դիտողների համար

Գաղտնիք 05. Կենդանացնել միայն անհրաժեշտության դեպքում

Որպես արտացոլման հեղինակ, հաճախ գայթակղիչ է անիմացիաներ ավելացնել ձեր վերջնական արտադրանքի մեջ: Անիմացիաները տվյալների և վիճակի փոփոխությունների հետ կապելու հզոր միջոց են: Այնուամենայնիվ, անիմացիաները կարող են նաև հանգեցնել ձեր տվյալների շփոթեցնող կամ ապակողմնորոշող մեկնաբանությունների: Դուք պետք է ուշադիր պլանավորեք, թե ինչպես դա կազդի ձեր ամբողջ արդյունքի վրա և ոչ թե պարզապես ավելացնեք այն ձեր աշխատանքի ավարտին: Անիմացիաներն ամենալավն են աշխատում, երբ նրանք կարող են բացահայտել տվյալների փոխհարաբերությունները, որոնք ցույց են տալիս, թե ինչպես են տվյալների խմբերը տարբեր նահանգների միջև, ինչպես են տվյալների փոփոխությունները ժամանակի ընթացքում կամ ինչպես են տվյալների կետերը ուղղակիորեն կապված:

Ընդհանուր առմամբ, ձեր անիմացիաները դարձրեք պարզ, կանխատեսելի և կրկին նվագարկելի: Թույլ տվեք օգտվողներին բազմիցս դիտել անիմացիան, որպեսզի նրանք կարողանան հետևել, թե որտեղ են սկսվում և ավարտվում օբյեկտները: Խուսափեք այլ օբյեկտների հետ անցումային փուլում գտնվող առարկաների խցանումից, ինչը դժվարացնում է հետևելը և անկանխատեսելի ուղիների երկայնքով օբյեկտների անցում կատարեք: Բարդ անիմացիաներով հետազոտությունը ենթադրում է, որ հեռուստադիտողների ըմբռնումը բարելավվում է, երբ անիմացիան բաժանվում է պարզ «բեմադրված» անցումների: Բեմը անիմացիան դադարեցնում է անցումային վիճակում գտնվող օբյեկտների հետ և դիտողին մեկ պահ է տրամադրում ՝ անդրադառնալու յուրաքանչյուր օբյեկտի վիճակի վրա:

Գործիքներ և ռազմավարություններ

  • Ձգտեք ձեր անիմացիաները հնարավորինս պարզ դարձնել
  • Հաշվի առեք բեմականացված անիմացիաները, երբ անիմացիան կամ բարդ է, կամ ունի անցումային շատ օբյեկտներ
  • Շողացող անիմացիաները սկզբում հաճախ զվարճալի են, բայց արագորեն հիասթափեցնող են դառնում հեռուստադիտողի համար: Մի ավելացրեք անիմացիա միայն այն պատճառով, որ կարող եք

Գաղտնիք 06. Արտացոլացումը վերլուծություն չէ

Դա դաշտի կենտրոնական դրույթն է, որը տվյալների արտացոլումը կարող է իմաստալից պատկերացում կազմել: Չնայած դրան շատ մեծ ճշմարտություն կա, կարևոր է հիշել, որ արտացոլումը գործիք է վերլուծությանը օգնելու համար, այլ ոչ թե վերլուծական հմտության փոխարինող: Դա նաև վիճակագրությանը չի փոխարինում. Ձեր աղյուսակը կարող է ընդգծել տվյալների կետերի միջև տարբերությունները կամ փոխկապակցվածությունը, բայց այս պատկերացումներից հուսալիորեն եզրակացություններ անելու համար հաճախ ավելի խիստ վիճակագրական մոտեցում է անհրաժեշտ: (Հակառակը կարող է ճշմարիտ լինել. Ինչպես ցույց է տալիս Anscombe- ի քառյակը, պատկերացումները կարող են բացահայտել տարբերությունների թաքցնելու վիճակագրությունը): Ձեր տվյալները իսկապես հասկանալու համար, ընդհանուր առմամբ, անհրաժեշտ է վերլուծական հմտությունների, տիրույթի փորձաքննության և ջանքերի համադրություն: Մի ակնկալեք, որ ձեր վիզուալիզացիան այս աշխատանքը կատարի ձեզ համար, և համոզվեք, որ կառավարում եք ձեր հաճախորդների և ձեր գործադիր տնօրենի սպասումները, երբ ստեղծում կամ գործարկում եք վիզուալիզացիա:

Գործիքներ և ռազմավարություններ

  • Քանի դեռ տվյալների վերլուծաբան չեք, շատ զգույշ եղեք իրական պատկերացում խոստանալու հարցում: Հաշվի առեք վիճակագրության կամ տիրույթի փորձագետի հետ աշխատելը, եթե անհրաժեշտ է առաջարկել հուսալի եզրակացություններ
  • Դիզայնի փոքր որոշումները ՝ ձեր կողմից օգտագործվող գույների ներկապնակ կամ ինչպես եք ներկայացնում որոշակի փոփոխական, կարող են շեղել այն եզրակացությունները, որոնք առաջարկում է պատկերացումը: Եթե ​​վերլուծության համար օգտագործում եք պատկերացումներ, փորձեք տարբեր տարբերակներ, այլ ոչ թե հույսը դնել մեկ տեսակետի վրա
  • Սթիվեն Ֆեվսը Հիմա դուք դա տեսնում եք առաջարկում է լավ գործնական ներդրում ՝ բիզնեսի վերլուծության համար արտացոլման օգտագործման համար, ներառյալ առաջարկներ մշակողների համար, թե ինչպես նախագծել վերլուծականորեն վավեր պատկերացման գործիքներ

Գաղտնիք # 07. Տվյալների արտացոլումը ավելին է, քան ծածկագիրը

Այժմ մատչելի գրադարանների և ձեռնարկների տեսականին ավելի հեշտ է, քան երբևէ, առանց մասնագիտական ​​փորձաքննության արտադրել որակյալ վեբ վրա հիմնված պատկերացումներ: Բայց իրական պատկերացում առաջարկող կամ տպավորիչ պատմություն պատմող պատկերացումներ ստեղծելը դեռևս ծածկագրումից բացի պահանջում է իրական հմտությունների հատկապես լայն շրջանակ, այդ թվում ՝ գրաֆիկական ձևավորում, տվյալների վերլուծություն և փոխըմբռնման ձևավորման և մարդու ընկալման ըմբռնում: Ոչ մի գրադարան կամ տեխնոլոգիա չի կարող փոխարինել իմանալով, թե ինչ ես անում:

Բայց այս գաղտնիքի ակնհայտ կողմն այն է, որ ձեզ հարկավոր չէ այդքան շատ բան իմանալ, մանավանդ եթե օգտագործում եք լավ պատկերացումների և փոխազդեցության սկզբունքներ: Բավական իմացեք ոլորտի մասին ՝ նորեկի սխալներից խուսափելու համար (միշտ ձեր զրոյական գծապատկերներից զրոյական բազային և երբեք գծային մասշտաբով շրջանագծի շառավիղ չսահմանեք), պարզ պահեք գործերը (առանց 3D, սահմանափակ անիմացիա, առանց ստվերաներկերի), ձեր աշխատանքը հիմնեք հիմնավոր օրինակների վրա: և դուք կարող եք ստեղծել հիանալի պատկերացումներ:

Բառեր ՝ Նեյթ Ագրին և Նիք Ռաբինովից

Նիկ Ռաբինովիցը ClearStory Data- ի տվյալների վիզուալիզացիայի ավագ մշակողն է: Նա ավելի քան 15 տարվա փորձ ունի վեբ և վիզուալիզացիայի նախագծերի վրա աշխատելու, առաջին հերթին շահույթ չհետապնդող, գիտական ​​և պետական ​​հատվածի հաճախորդների համար:

Նեյթ Ագրինը «Looker» - ի Visualization- ի տնօրենն է: Նա ուսումնասիրել է տեղեկատվության և արտացոլման տեսությունը UC Berkeley- ում և աշխատել է Splunk- ի և Twitter- ի նման ընկերություններում `նպաստելով նրանց վեբ վրա հիմնված միջերեսներին:

Հոդվածներ Ձեզ Համար
Վեբ ձևավորման և մշակման նոր գործիքներ. Հունվար 2013
Հայտնաբերել

Վեբ ձևավորման և մշակման նոր գործիքներ. Հունվար 2013

Օգտատիրոջ մուտքի հավաքագրումը և վավերացումը կարծես թե թեմա է, որը տարածված է 2013-ի առաջին օրերին: Առաջնային ձևի ստուգումը, բովանդակության խորը խմբագրումը, նույնիսկ օգտագործողի մարդկության հաստատման խ...
7 հիանալի ռեսուրսներ, որոնք կօգնեն ձեր կայքը ավելի հուսալի դարձնել
Հայտնաբերել

7 հիանալի ռեսուրսներ, որոնք կօգնեն ձեր կայքը ավելի հուսալի դարձնել

Մենք ձեզ արդեն տրամադրել ենք 10 օգտակար խորհուրդներ, որպեսզի մարդիկ վստահեն ձեր կայքին ՝ նրանց հուսալի ինտերֆեյս տրամադրելով, բայց ինչպե՞ս եք տեղափոխվում տեսությունից դեպի ձեր նոր UX հանճարեղ դիզայնը ...
Ստեղծագործական հյուծումներից խուսափելու 5 պարզ եղանակ
Հայտնաբերել

Ստեղծագործական հյուծումներից խուսափելու 5 պարզ եղանակ

Որպես ստեղծագործական անկախ մասնագետ և օրեկան աշխատող ժամերի քանակի պատճառով ես բախվում եմ այրվելու իրական իրական ներուժի հետ: Հյուծվածությունից խուսափելու գաղտնիքը բախտը չի բերել, դա կրակը վառ պահելու...