From f9226befbd49e4eba8909aa430ce7407551bba62 Mon Sep 17 00:00:00 2001
From: Sean Eagan <seaneagan1@gmail.com>
Date: Tue, 13 Apr 2021 16:15:08 -0500
Subject: [PATCH] Complete workload load balancer implementation

- Add API to configure a node port range
- Map each port to same port on sub-cluster
- Implement haproxy settings for workload services, including tcp connect
  health checks

TODO (later):
- The existing singular NodePort field is now ignored for this service,
  since the node port range is used instead, and so should be removed,
  which will require some refactoring of base service types.

Change-Id: I6a5be3e330270c13c3d42c8bba4004b67524911d
---
 .../airship.airshipit.org_sipclusters.yaml    |  17 ++
 .../samples/airship_v1beta1_sipcluster.yaml   |   5 +-
 docs/api/sipcluster.md                        |  57 +++++
 pkg/api/v1/sipcluster_types.go                |  11 +
 pkg/api/v1/zz_generated.deepcopy.go           |  16 ++
 pkg/bmh/bmh_test.go                           |  24 +++
 pkg/services/loadbalancer.go                  | 196 +++++++++---------
 testutil/testutil.go                          |   4 +
 8 files changed, 235 insertions(+), 95 deletions(-)
diff --git a/config/crd/bases/airship.airshipit.org_sipclusters.yaml b/config/crd/bases/airship.airshipit.org_sipclusters.yaml
index 63e12bb..0abd6ab 100644
--- a/config/crd/bases/airship.airshipit.org_sipclusters.yaml
+++ b/config/crd/bases/airship.airshipit.org_sipclusters.yaml
@@ -202,9 +202,26 @@ spec:
                           type: object
                         nodePort:
                           type: integer
+                        nodePortRange:
+                          description: 'TODO: Remove the inherited single NodePort
+                            field via refactoring. It is unused for this service since
+                            we have the below node port range instead.'
+                          properties:
+                            end:
+                              description: End is the ending port number in the range.
+                              type: integer
+                            start:
+                              description: Start is the starting port number in the
+                                range.
+                              type: integer
+                          required:
+                          - end
+                          - start
+                          type: object
                       required:
                       - image
                       - nodePort
+                      - nodePortRange
                       type: object
                     type: array
                 type: object
diff --git a/config/samples/airship_v1beta1_sipcluster.yaml b/config/samples/airship_v1beta1_sipcluster.yaml
index b3de3a7..0459f5e 100644
--- a/config/samples/airship_v1beta1_sipcluster.yaml
+++ b/config/samples/airship_v1beta1_sipcluster.yaml
@@ -54,6 +54,9 @@ spec:
         # nodeLabels:
         #   kubernetes.io/os
         nodePort: 30002
+        nodePortRange:
+          start: 30002
+          end: 30011
         nodeInterfaceId: oam-ipv4
         # NOTE: clusterIP has not yet been implemented.
-        # clusterIP: 1.2.3.4 # IP of the base cluster VIP
+        # clusterIP: 1.2.3.4 # IP of the base cluster VIP
\ No newline at end of file
diff --git a/docs/api/sipcluster.md b/docs/api/sipcluster.md
index 3f726f7..872a3a0 100644
--- a/docs/api/sipcluster.md
+++ b/docs/api/sipcluster.md
@@ -184,6 +184,20 @@ SIPClusterService
 </p>
 </td>
 </tr>
+<tr>
+<td>
+<code>nodePortRange</code><br>
+<em>
+<a href="#airship.airshipit.org/v1.PortRange">
+PortRange
+</a>
+</em>
+</td>
+<td>
+<p>TODO: Remove the inherited single NodePort field via refactoring. It is unused for this
+service since we have the below node port range instead.</p>
+</td>
+</tr>
 </tbody>
 </table>
 </div>
@@ -299,6 +313,49 @@ NodeCount
 </table>
 </div>
 </div>
+<h3 id="airship.airshipit.org/v1.PortRange">PortRange
+</h3>
+<p>
+(<em>Appears on:</em>
+<a href="#airship.airshipit.org/v1.LoadBalancerServiceWorker">LoadBalancerServiceWorker</a>)
+</p>
+<p>PortRange represents a range of ports.</p>
+<div class="md-typeset__scrollwrap">
+<div class="md-typeset__table">
+<table>
+<thead>
+<tr>
+<th>Field</th>
+<th>Description</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>
+<code>start</code><br>
+<em>
+int
+</em>
+</td>
+<td>
+<p>Start is the starting port number in the range.</p>
+</td>
+</tr>
+<tr>
+<td>
+<code>end</code><br>
+<em>
+int
+</em>
+</td>
+<td>
+<p>End is the ending port number in the range.</p>
+</td>
+</tr>
+</tbody>
+</table>
+</div>
+</div>
 <h3 id="airship.airshipit.org/v1.SIPCluster">SIPCluster
 </h3>
 <p>SIPCluster is the Schema for the sipclusters API</p>
diff --git a/pkg/api/v1/sipcluster_types.go b/pkg/api/v1/sipcluster_types.go
index 8707359..528b3ef 100644
--- a/pkg/api/v1/sipcluster_types.go
+++ b/pkg/api/v1/sipcluster_types.go
@@ -96,6 +96,17 @@ type LoadBalancerServiceControlPlane struct {
 // LoadBalancerServiceWorker is an infrastructure service type that represents the sub-cluster load balancer service.
 type LoadBalancerServiceWorker struct {
 	SIPClusterService `json:",inline"`
+	// TODO: Remove the inherited single NodePort field via refactoring. It is unused for this
+	// service since we have the below node port range instead.
+	NodePortRange PortRange `json:"nodePortRange"`
+}
+
+// PortRange represents a range of ports.
+type PortRange struct {
+	// Start is the starting port number in the range.
+	Start int `json:"start"`
+	// End is the ending port number in the range.
+	End int `json:"end"`
 }
 
 // SIPClusterStatus defines the observed state of SIPCluster
diff --git a/pkg/api/v1/zz_generated.deepcopy.go b/pkg/api/v1/zz_generated.deepcopy.go
index ad82dfc..09847bc 100644
--- a/pkg/api/v1/zz_generated.deepcopy.go
+++ b/pkg/api/v1/zz_generated.deepcopy.go
@@ -86,6 +86,7 @@ func (in *LoadBalancerServiceControlPlane) DeepCopy() *LoadBalancerServiceContro
 func (in *LoadBalancerServiceWorker) DeepCopyInto(out *LoadBalancerServiceWorker) {
 	*out = *in
 	in.SIPClusterService.DeepCopyInto(&out.SIPClusterService)
+	out.NodePortRange = in.NodePortRange
 }
 
 // DeepCopy is an autogenerated deepcopy function, copying the receiver, creating a new LoadBalancerServiceWorker.
@@ -134,6 +135,21 @@ func (in *NodeSet) DeepCopy() *NodeSet {
 	return out
 }
 
+// DeepCopyInto is an autogenerated deepcopy function, copying the receiver, writing into out. in must be non-nil.
+func (in *PortRange) DeepCopyInto(out *PortRange) {
+	*out = *in
+}
+
+// DeepCopy is an autogenerated deepcopy function, copying the receiver, creating a new PortRange.
+func (in *PortRange) DeepCopy() *PortRange {
+	if in == nil {
+		return nil
+	}
+	out := new(PortRange)
+	in.DeepCopyInto(out)
+	return out
+}
+
 // DeepCopyInto is an autogenerated deepcopy function, copying the receiver, writing into out. in must be non-nil.
 func (in *SIPCluster) DeepCopyInto(out *SIPCluster) {
 	*out = *in
diff --git a/pkg/bmh/bmh_test.go b/pkg/bmh/bmh_test.go
index 547db54..fc05f6a 100644
--- a/pkg/bmh/bmh_test.go
+++ b/pkg/bmh/bmh_test.go
@@ -153,6 +153,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ipv4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
@@ -218,6 +222,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ipv4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
@@ -281,6 +289,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ipv4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
@@ -348,6 +360,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ip4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
@@ -409,6 +425,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ipv4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
@@ -469,6 +489,10 @@ var _ = Describe("MachineList", func() {
 						NodePort:      30002,
 						NodeInterface: "oam-ipv4",
 					},
+					NodePortRange: airshipv1.PortRange{
+						Start: 30002,
+						End:   30011,
+					},
 				},
 			},
 		}
diff --git a/pkg/services/loadbalancer.go b/pkg/services/loadbalancer.go
index 0165b7b..a30955c 100644
--- a/pkg/services/loadbalancer.go
+++ b/pkg/services/loadbalancer.go
@@ -16,6 +16,7 @@ package services
 
 import (
 	"bytes"
+	"fmt"
 	"strings"
 
 	"html/template"
@@ -112,12 +113,7 @@ func (lb loadBalancer) generateDeploymentAndSecret(instance string, labels map[s
 							Name:            LoadBalancerServiceName,
 							Image:           lb.config.Image,
 							ImagePullPolicy: corev1.PullIfNotPresent,
-							Ports: []corev1.ContainerPort{
-								{
-									Name:          "http",
-									ContainerPort: 6443,
-								},
-							},
+							Ports:           lb.getContainerPorts(),
 							VolumeMounts: []corev1.VolumeMount{
 								{
 									Name:      ConfigSecretName,
@@ -144,10 +140,21 @@ func (lb loadBalancer) generateDeploymentAndSecret(instance string, labels map[s
 	return deployment, secret, nil
 }
 
+func (lb loadBalancer) getContainerPorts() []corev1.ContainerPort {
+	containerPorts := []corev1.ContainerPort{}
+	for _, servicePort := range lb.servicePorts {
+		containerPorts = append(containerPorts, corev1.ContainerPort{
+			Name:          servicePort.Name,
+			ContainerPort: servicePort.Port,
+		})
+	}
+	return containerPorts
+}
+
 func (lb loadBalancer) generateSecret(instance string) (*corev1.Secret, error) {
 	p := proxy{
-		FrontPort: 6443,
-		Backends:  make([]backend, 0),
+		ContainerPorts: lb.getContainerPorts(),
+		Servers:        make([]server, 0),
 	}
 	for _, machine := range lb.machines.Machines {
 		if machine.BMHRole == lb.bmhRole {
@@ -161,7 +168,7 @@ func (lb loadBalancer) generateSecret(instance string) (*corev1.Secret, error) {
 				)
 				continue
 			}
-			p.Backends = append(p.Backends, backend{IP: ip, Name: machine.BMH.Name, Port: 6443})
+			p.Servers = append(p.Servers, server{IP: ip, Name: machine.BMH.Name})
 		}
 	}
 	secretData, err := lb.generateTemplate(p)
@@ -187,13 +194,7 @@ func (lb loadBalancer) generateService(instance string, labels map[string]string
 			Namespace: lb.sipName.Namespace,
 		},
 		Spec: corev1.ServiceSpec{
-			Ports: []corev1.ServicePort{
-				{
-					Name:     "http",
-					Port:     6443,
-					NodePort: int32(lb.config.NodePort),
-				},
-			},
+			Ports:    lb.servicePorts,
 			Selector: labels,
 			Type:     corev1.ServiceTypeNodePort,
 		},
@@ -201,24 +202,24 @@ func (lb loadBalancer) generateService(instance string, labels map[string]string
 }
 
 type proxy struct {
-	FrontPort int
-	Backends  []backend
+	ContainerPorts []corev1.ContainerPort
+	Servers        []server
 }
 
-type backend struct {
+type server struct {
 	IP   string
 	Name string
-	Port int
 }
 
 type loadBalancer struct {
-	client   client.Client
-	sipName  types.NamespacedName
-	logger   logr.Logger
-	config   airshipv1.SIPClusterService
-	machines *bmh.MachineList
-	bmhRole  airshipv1.BMHRole
-	template string
+	client       client.Client
+	sipName      types.NamespacedName
+	logger       logr.Logger
+	config       airshipv1.SIPClusterService
+	machines     *bmh.MachineList
+	bmhRole      airshipv1.BMHRole
+	template     string
+	servicePorts []corev1.ServicePort
 }
 
 type loadBalancerControlPlane struct {
@@ -236,17 +237,25 @@ func newLBControlPlane(name, namespace string,
 	config airshipv1.LoadBalancerServiceControlPlane,
 	machines *bmh.MachineList,
 	client client.Client) loadBalancerControlPlane {
+	servicePorts := []corev1.ServicePort{
+		{
+			Name:     "http",
+			Port:     6443,
+			NodePort: int32(config.NodePort),
+		},
+	}
 	return loadBalancerControlPlane{loadBalancer{
 		sipName: types.NamespacedName{
 			Name:      name,
 			Namespace: namespace,
 		},
-		logger:   logger,
-		config:   config.SIPClusterService,
-		machines: machines,
-		client:   client,
-		bmhRole:  airshipv1.RoleControlPlane,
-		template: templateControlPlane,
+		logger:       logger,
+		config:       config.SIPClusterService,
+		machines:     machines,
+		client:       client,
+		bmhRole:      airshipv1.RoleControlPlane,
+		template:     templateControlPlane,
+		servicePorts: servicePorts,
 	},
 		config,
 	}
@@ -257,17 +266,26 @@ func newLBWorker(name, namespace string,
 	config airshipv1.LoadBalancerServiceWorker,
 	machines *bmh.MachineList,
 	client client.Client) loadBalancerWorker {
+	servicePorts := []corev1.ServicePort{}
+	for port := config.NodePortRange.Start; port <= config.NodePortRange.End; port++ {
+		servicePorts = append(servicePorts, corev1.ServicePort{
+			Name:     fmt.Sprintf("port-%d", port),
+			Port:     int32(port),
+			NodePort: int32(port),
+		})
+	}
 	return loadBalancerWorker{loadBalancer{
 		sipName: types.NamespacedName{
 			Name:      name,
 			Namespace: namespace,
 		},
-		logger:   logger,
-		config:   config.SIPClusterService,
-		machines: machines,
-		client:   client,
-		bmhRole:  airshipv1.RoleWorker,
-		template: templateWorker,
+		logger:       logger,
+		config:       config.SIPClusterService,
+		machines:     machines,
+		client:       client,
+		bmhRole:      airshipv1.RoleWorker,
+		template:     templateWorker,
+		servicePorts: servicePorts,
 	},
 		config,
 	}
@@ -318,18 +336,15 @@ defaults
   timeout server          600s
 
 #---------------------------------------------------------------------
-# apiserver frontend which proxys to the masters
-#---------------------------------------------------------------------
-frontend apiserver
-  bind *:{{ .FrontPort }}
+{{- $servers := .Servers }}
+{{- range .ContainerPorts }}
+{{- $containerPort := . }}
+frontend {{ $containerPort.Name }}-frontend
+  bind *:{{ $containerPort.ContainerPort }}
   mode tcp
   option tcplog
-  default_backend kube-apiservers
-
-#---------------------------------------------------------------------
-# round robin balancing for apiserver
-#---------------------------------------------------------------------
-backend kube-apiservers
+  default_backend {{ $containerPort.Name }}-backend
+backend {{ $containerPort.Name }}-backend
   mode tcp
   balance     roundrobin
   option httpchk GET /readyz
@@ -339,56 +354,49 @@ backend kube-apiservers
   # downinter 2s makes it check more frequently to recover from that state sooner.
   # Also changing fall to 4 so that it takes longer (4 failures) for it to take down a backend.
   default-server check check-ssl verify none inter 5s downinter 2s fall 4 on-marked-down shutdown-sessions
-{{- range .Backends }}
-{{- $backEnd := . }}
-  server {{ $backEnd.Name }} {{ $backEnd.IP }}:{{ $backEnd.Port }}
+{{- range $servers }}
+{{- $server := . }}
+  server {{ $server.Name }} {{ $server.IP }}:{{ $containerPort.ContainerPort }}
+{{ end -}}
 {{ end -}}`
 
-// TODO Update this template to work for workload services, as it currently references api server(control plane)
 var templateWorker = `global
-  log stdout format raw local0 notice
-  daemon
+log stdout format raw local0 notice
+daemon
+
 defaults
-  mode                    http
-  log                     global
-  option                  httplog
-  option                  dontlognull
-  retries                 1
-  # Configures the timeout for a connection request to be left pending in a queue
-  # (connection requests are queued once the maximum number of connections is reached).
-  timeout queue           30s
-  # Configures the timeout for a connection to a backend server to be established.
-  timeout connect         30s
-  # Configures the timeout for inactivity during periods when we would expect
-  # the client to be speaking. For usability of 'kubectl exec', the timeout should
-  # be long enough to cover inactivity due to idleness of interactive sessions.
-  timeout client          600s
-  # Configures the timeout for inactivity during periods when we would expect
-  # the server to be speaking. For usability of 'kubectl log -f', the timeout should
-  # be long enough to cover inactivity due to the lack of new logs.
-  timeout server          600s
+mode                    tcp
+log                     global
+option                  tcplog
+option                  dontlognull
+retries                 1
+# Configures the timeout for a connection request to be left pending in a queue
+# (connection requests are queued once the maximum number of connections is reached).
+timeout queue           30s
+# Configures the timeout for a connection to a backend server to be established.
+timeout connect         30s
+# Configures the timeout for inactivity during periods when we would expect
+# the client to be speaking.
+timeout client          600s
+# Configures the timeout for inactivity during periods when we would expect
+# the server to be speaking.
+timeout server          600s
+
 #---------------------------------------------------------------------
-# apiserver frontend which proxys to the masters
-#---------------------------------------------------------------------
-frontend apiserver
-  bind *:{{ .FrontPort }}
-  mode tcp
-  option tcplog
-  default_backend kube-apiservers
-#---------------------------------------------------------------------
-# round robin balancing for apiserver
-#---------------------------------------------------------------------
-backend kube-apiservers
-  mode tcp
+{{- $servers := .Servers }}
+{{- range .ContainerPorts }}
+{{- $containerPort := . }}
+frontend {{ $containerPort.Name }}-frontend
+  bind *:{{ $containerPort.ContainerPort }}
+  default_backend {{ $containerPort.Name }}-backend
+backend {{ $containerPort.Name }}-backend
   balance     roundrobin
-  option httpchk GET /readyz
-  http-check expect status 200
+  option tcp-check
+  tcp-check connect
   option log-health-checks
-  # Observed apiserver returns 500 for around 10s when 2nd cp node joins.
-  # downinter 2s makes it check more frequently to recover from that state sooner.
-  # Also changing fall to 4 so that it takes longer (4 failures) for it to take down a backend.
-  default-server check check-ssl verify none inter 5s downinter 2s fall 4 on-marked-down shutdown-sessions
-{{- range .Backends }}
-{{- $backEnd := . }}
-  server {{ $backEnd.Name }} {{ $backEnd.IP }}:{{ $backEnd.Port }}
+default-server check
+{{- range $servers }}
+{{- $server := . }}
+  server {{ $server.Name }} {{ $server.IP }}:{{ $containerPort.ContainerPort }}
+{{ end -}}
 {{ end -}}`
diff --git a/testutil/testutil.go b/testutil/testutil.go
index 51432a4..548ada0 100644
--- a/testutil/testutil.go
+++ b/testutil/testutil.go
@@ -288,6 +288,10 @@ func CreateSIPCluster(name string, namespace string, controlPlanes int, workers
 								NodeInterface: "eno3",
 								NodePort:      30002,
 							},
+							NodePortRange: airshipv1.PortRange{
+								Start: 30002,
+								End:   30011,
+							},
 						},
 					},
 				},

Field	Description
+`start` + +int + +	+ Start is the starting port number in the range. +
+`end` + +int + +	+ End is the ending port number in the range. +