Hvad er forskellen mellem big data og DBMS?


Svar 1:

Jeg synes, det er forkert at tænke på Big Data og DBMS med hensyn til emner, der kan sammenlignes.

En database er en struktureret enhed, der er målrettet mod at gemme, hente og analysere en bestemt type data, velordnet i poster (datasæt) og felter (komponenter i datasæt). Såsom adresselister, kundelister.

En database kan have (og i alle praktiske ikke-trivielle applikationer vil have) flere tabeller med forskellige slags poster, indbyrdes forbundet med foruddefinerede nøgler.

Tværtimod er Big Data ikke en struktur, ikke engang en klart defineret metode. Med dens oprindelse er den mere eller mindre trivielle udsagn, at når du har "nok" data, kan du komme med nøjagtige udsagn og forudsigelser om personer, grupper, begivenheder og alt det der. Big Data er således en slags dataanalyse.

Til dette formål er der udviklet en masse værktøjer til at styre enorme mængder data. Bedst kendt er Map-Reduce-metodologien, der er udviklet af Google. Andre interessante koncepter er f.eks. Hadoop.

Hovedproblemet i Big Data-analyse er at få noget ud af tilsyneladende ustrukturerede data fra mange forskellige kilder (strukturerede databaser, tekstfiler, data på sociale medier, vejrrapporter, trafikrapporter, ...). Det er det, Map-Reduce og Hadoop handler om.

Mellemliggende og sidste trin i processen er derefter klassisk dataanalyse, såsom korrelation, hvor de velkendte værktøjer som R eller SPMS anvendes.

Der er mange udfordringer inden for it-domænet. Normalt skal analysen udføres parallelt på flere servere, og det er kun et eksempel.


Svar 2:

Stort betyder stort, men hvad der er stort for nogle er ikke så stort for andre.

De fleste af højkvalitets RDBMS-systemerne er helt glade for at håndtere terabytter af data; mange er ganske rimelige med petabytes. Mange af de mennesker, der narrer til "big data" -løsninger, gør det med små dataproblemer, der i det mest optimistiske tilfælde vil vokse til mellemstore dataproblemer. Det kan være dårligt tilrådeligt for et ungt par at købe en lufthavnsbuss som deres primære transport forud for fremtidige vækstbehov.


Svar 3:

Big data betyder et datasæt, der er stort, enten fordi det har en masse variabler eller en masse observationer eller begge dele.

Big data refererer ofte (men på ingen måde altid) til data, der ikke er samlet med de analytiske formål for øje.

Big Data er et buzzword, der indebærer, uanset hvad den person, der bruger det, ønsker at antyde.

Et DBMS (database management system) er et softwaresystem, der giver dig mulighed for at gemme og hente data på en effektiv og organiseret måde.

Nogle databasesystemer følger de fleste af disse regler, og nogle følger kun nogle bestemte regler.

DBMS understøtter ikke distribueret, men SQL understøtter.


Svar 4:

Big data betyder et datasæt, der er stort, enten fordi det har en masse variabler eller en masse observationer eller begge dele.

Big data refererer ofte (men på ingen måde altid) til data, der ikke er samlet med de analytiske formål for øje.

Big Data er et buzzword, der indebærer, uanset hvad den person, der bruger det, ønsker at antyde.

Et DBMS (database management system) er et softwaresystem, der giver dig mulighed for at gemme og hente data på en effektiv og organiseret måde.

Nogle databasesystemer følger de fleste af disse regler, og nogle følger kun nogle bestemte regler.

DBMS understøtter ikke distribueret, men SQL understøtter.