Categories

    Shenzhen "OK" Biotech-Technologie Co., Ltd.(SZOB)

    HK hinzufügen: 6/F, Fo Tan Industrial Centre, 26-28 Au Pui Wan St, Fo Tan, Shatin, Hongkong

    China Festland hinzufügen: 8F, Fuxuan Gebäude, Nr. 46, East Heping Rd, Longhua New District, Shenzhen, VR China

    E-Mail:Nicole@OK-Biotech.com

        Smile@OK-Biotech.com

    Web: www.ok-biotech.com

    Tel: + 852 6679 4580

Startseite > News > Inhalt

Google-Feuer, Funken, Hadoop-Service in der Cloud

www.OK-Biotech.com

Google-Feuer, Funken, Hadoop-Service in der Cloud

Wenn Google eine Menge über eine Sache weiß, ist es, dass Entwickler nicht wollen, verbringen viel Zeit die Einrichtung Infrastruktur nur so sie Anwendungen, die kauen auf große Datenmengen schaffen für den Geschäftsbetrieb.


Während viele von uns Google für seine Systeme und Datacenter Designs bewundern, das, was wirklich Google mächtig macht ist seine Fähigkeit, schnell neue Technologien entwickeln und bilden sie einfach für Programmierer zu nutzen. Das ist die Natur der Clustercontroller Borg und vielen Frameworks, die in Verbindung mit ihm zu arbeiten.


Sie müssen nicht für Google, wie Google, aber arbeiten. Vor der Schichten + Hadoop World Konferenz nächste Woche in New York, Google hat angekündigt, Cloud Dataproc, die Pakete, die Kombination von Hadoop Lagerung und Funken in-Memory-Analysen und bietet als Dienstleistung. Cloud Dataproc – die Abkürzung für Datenverarbeitung, natürlich eine sehr alte Schule bezeichnen, denn was wir alles noch tun – im Betatest jetzt; der Zeitplan für die kommerzielle Version des Dienstes wurde nicht bekanntgegeben.


Die Preise für Cloud Dataproc ist sicher bekommen die Aufmerksamkeit der Menschen, die denken über das Einrichten von Hadoop oder Funken Analytics-Cluster, das ist ein Schmerz im Nacken und die Experten zu pflegen. Google lädt einen Pfennig pro virtueller Maschine pro Stunde in den virtuellen Clustern, die er verwaltet im Namen Cloud Dataproc Benutzer. (Dies ist zusätzlich Gebühren für berechnen Motor Instanzen, Netzwerk-Bandbreite und Speicher, die Kunden entstehen, um die Cluster einrichten.)  Cloud Dataproc lauffähig auf regelmäßige reserviert und on-Demand Instances sowie die neuen preemptible Instanzen, die Google vor ein paar Wochen debütierte. Preise wird auf die nächste Minute mit einem zehnminütigen minimale Abrechnungszeitraum gerundet.


Geschwindigkeit ist auch etwas, das Google versucht, zu verkaufen. In einem Blogbeitrag kündigt den Spark/Hadoop-Service sagt James Malone, Produktmanager für das Unternehmen Cloud-Plattform public Cloud, dass Google Hadoop oder Funken Cluster innerhalb von 90 Sekunden beginnen und es skalieren oder etwa zu dieser Zeit – oder weniger Herunterfahren. Google hat sich entschieden, Hadoop und Funken auf die Debian 7-Distribution von Linux in Cloud-Plattform erstellen Sie den Dienst ausführen; vermutlich wird die open-Source Apache-Versionen der Hadoop und Funken Stacks verwendet.


"Eines der großen Features des Dataproc, dass wir versuchen, die Bedürfnisse der Kunden zu beantworten, die mehr Kontrolle über ein Cluster möchten", sagt Malone die Plattform. "Kunden haben ihre Daten und Arbeitsabläufe auf Hadoop und Funken, aber sie nicht stundenlang Einrichten von VMs, die Binärdateien zu verteilen und so weiter. Open-Source-Software ist groß, aber es kommt in der Regel mit Hunderten von Schaltern und Reglern fein abstimmen und wählen. Das, was, das wir versucht, mit Dataproc zu tun, ist, haben einen großen Schalter und es ist auf, und wenn Sie fertig sind können Sie es deaktivieren."


Malone sagt, dass die Cloud Dataproc drei bis Hunderte von virtuellen Knoten skalieren können und integriert mit Google-Cloud-Speicher, den Objekt-Storage-Dienst, die mit Compute-Engine arbeitet. (Die Standard-Replikation für Daten liegt bei zwei, nicht die üblichen drei in Hadoop-Cluster verwendet.) Dieser Speicher hat eine Mischung von Festplatten und Flash-SSDs um gute Leistung zu gewährleisten, und wichtig ist, wenn Daten in Cloud-Speicher gespeichert werden, auch beim Ausschalten des Cloud Dataproc Clusters, diese Daten anhalten um wieder verwendet werden. So kann in gewisser Weise, anstatt die ephemere Speicherung, die häufig in den frühen Tagen des Cloud-computing, wurde dies von als ephemere Compute mit persistenten Speicher aufgefasst werden. Malone sagt uns, dass Kunden können HDFS auf der lokalen Festplatte oder Flash-Speicher in ihre Serverinstanzen einrichten, aber sobald der Cluster deaktiviert ist, die Daten sind Weg. Google empfiehlt HDFS auf Cloud-Speicher aus diesem Grund setzen.


Das heißt, die Cloud Dataproc Cluster auch bestehen bleibt, solange Sie zahlen für die Compute-Engine-Instanzen Untermauerung dieser virtuellen Hadoop und Spark-Cluster. Google warnt, dass ein Wolke Dataproc-Cluster beschränkt sich auf maximal 24 CPUs und 240 VM-Instanzen, wie anderen Motor Compute-Ressourcen und Sie für jede Kapazität hinausgehende Fragen müssen. Benötigen Sie Leistung Gans, holen Sie berechnen Motor Instanzen mit lokalen SSDs.


Cloud Dataproc nicht unterstützen MapReduce-Batch-Jobs und speicherinterne Verarbeitung zu wecken, sondern können auch laufen auf der Hive Warehouse Datenschicht auf Hadoop Distributed File System Support-Anwendungen sowie Anwendungen, die das Schwein-scripting-Tool verwenden, um ihre MapReduce-Abfragen zu parallelisieren. Die Sprachen, die von Hadoop und Funken – Java, Scala, Python und R – unterstützt werden sind mit dem Dataproc der Cloud-Dienst unterstützt. Der Dienst verfügt noch nicht über eine offizielle Vereinbarung zum Servicelevel, aber werden, wenn sie in der Regel verfügbar. Cloud Dataproc gibt es in allen Regionen und Zonen in der Google public Cloud. Malone war nicht frei, zu sagen, wann Cloud Dataproc allgemein verfügbar sein würde.


Cloud Dataproc-Stack wurde in alpha-Tests für ein paar Monate und startet in der Beta heute Unterstützung von Hadoop 2.7.1 und Funken 1,5. Programmierer können erstellen und zerstören von Cloud Dataproc Cluster aus einem Satz von APIs, aus dem Google-Cloud-SDK oder über die Google-Entwickler-Konsole.


Google hat nicht erwarten, für Kunden unbedingt Cloud Dataproc anstelle von seinen BigQuery und Cloud Bigtable Dienstleistungen verwenden, die wir hier gemeldet. (Cloud Bigtable ist ein Dienst, der die interne Datenbank-Overlay für Google File System spiegelt das Hive inspiriert, und BigQuery ist ein Ad-hoc-Abfrage-Service für nur-Lese Arbeit, Google erstellt und das inspiriert, unter anderem Amazon DynamoDB und Facebooks Cassandra.) Da die Cloud Dataproc Cloud Bigtable und BigQuery verknüpft werden kann, es kann verwendet werden, zum Beispiel die Daten, die Massage vor der Log-Dateien zu tun und anderen Telemetrie, die aus Systemen und Anwendungen ist in Dienstleistungen wie BigQuery und Cloud Bigtable und dann vielleicht in Tools wie Tableau visualisiert. Malone sagt, dass einige Kunden im alpha Programm für Cloud Dataproc mehr Skala oder niedrigere Kosten für ihre Infrastruktur Hadoop und Funken gesucht, und einige waren auf der Suche um es einfacher für Entwickler, um einen Cluster zu testen, ihre Daten und Algorithmen zu drehen.


Google-Konkurrent Amazon Web Services löschte seinen Elastic MapReduce-Service in der Beta zu Hadoop im April 2009 als Dienstleistung anbieten, und es war danach für den Produktiveinsatz in Kürze zur Verfügung. AWS bietet der Apache-Distribution von Hadoop auf seiner virtuellen Clustern und auch kann Kunden die Hadoop-Verteilung von MapR Technologien nutzen. Amazon Preis ist für den EMR managed Service einiges höher als das was Google für Cloud Dataproc Aufladen ist, unterschiedliche zusammen mit den Kosten der zugrunde liegenden EC2-Instanzen, die es macht nutzen. EC2-Instances ausführen von 4,4 Cent pro Stunde für eine eine m1.small Instanz auf einen Höchststand von $5,52 pro Stunde für eine d2.8xlarge Lagerung optimiert Instanz; der EMR-Dienst fügt 1,1 Cent auf 27 Cent pro Stunde auf diese EC2-Gebühren. (On Demand-Instances in der Region USA Ost sind, können Sie senken die Kosten mit reservierten Instanzen.) Amazon nur zusätzliche Unterstützung für Spark EMR im Juni und im Juli neu EMR mit einer Version 4.0, die Hadoop 2.6.0, Spark 1.4.1, Hive 1.0 und Schwein 0,14 enthält.


Microsoft hat ebenso einen Hadoop-Service auf die Azure-Cloud, die er HDInsight nennt und die auf die Hortonworks Datenplattform Verteilung dieser Analytics-Plattform basiert. Microsoft unterstützt neben Hadoop Funken im Arbeitsspeicher Verarbeitung und Sturm Stream Verarbeitung Add-ons. Kunden können HDInsight unter Windows oder Linux auf die Azure-Cloud, und Microsoft Bundles im Preis für die Berechnung und den Dienst in seine Preiskalkulation, welche reicht von 8 Cent pro Stunde für eine Instanz von A1 bis $1,41 pro Stunde für eine A7-Instanz bereitstellen. Wenn Sie kaufen diese Instanzen rohen unter Linux auf Azure, sie Kosten von 1,8 Cent pro Stunde für die A1-Instanz auf $1 pro Stunde für eine A7-Instanz. Microsoft lädt also ebenso eine höhere Prämie für die managed Services von Hadoop/Spark als Google.


Tags: Sildenafil, 139755-83-2, Flibanserin, 167933-07-5, Tadalafil, Cialis, 171596-29-5, Vardenafil Hydrochlorid, 224785-91-5,


Produkte der kategorie
Kontaktieren Sie uns
Adresse: HK: 6/F, Fo Tan Industrial Centre, 26-28 Au Pui Wan St, Fo Tan, Shatin, Hong Kong-Shenzhen: 8F, Fuxuan Gebäude, Nr. 46, Osten Heping Rd, Longhua New District, Shenzhen, VR China
Telefon: +852 6679 4580
 Fax:
 E-Mail:smile@ok-biotech.com
Shenzhen "OK" Biotech-Technologie Co., Ltd.(SZOB)
Share: